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La pr6sente invention est relative k des sequences nucl6iques 
codant pour une proline apte k interagir avec le recepteur AT2, ^ des oligo- 
nucleotides compris dans lesdites sequences, h leurs applications en tant que 
sondes et pour I'expression desdites prot^ines, aux vecteurs utiles pour ladite 
expression, aux hotes cellulaires contenant lesdits vecteurs, ainsi qu'k un 
module d'etude du recepteur AT2. 

La pr6sente invention est 6galement relative aux dites pro- 
twines ainsi qu'^ leurs applications. 

L'octapeptide angiotensine II, principalement connu comme 
r6gulateur de la pression artWrielle, a egalement 6te d6crit comme un impor- 
tant modulateur de la croissance cellulaire. De fagon intWressante ce peptide 
semble exercer des effets opposes sur la croissance cellulaire, selon qu'il se lie 
sur I'un ou I'autie de ses deux sous-types de recepteurs membranaires (ATI 
ou AT2). 

Le rScepteur de sous-type AT2, qui appartient aussi k la 
famille des recepteurs coupl6s aux prot6ines G, est encore mal caracterise tant 
du point de vue de ses mWcanismes d'activation que de son r6le physiologique 
(C. Nahmias et al.. Trends Pharmacol Sci, 1995, 16, 223-225). Plusieurs 
arguments sugg^rent cependant un r61e de ce recepteur dans les ph6nom6nes 
de proliferation, de differenciation ou d' adhesion cellulaire. 

Le recepteur AT2 est fortement exprime au coxxrs de la vie 
foetale, disparait chez I'adulte dans la plupart des tissus, mais se trouve 
reexprime dans des conditions pathdphysiologiques impliquant la restructu- 

ration des tissus. 

Des etudes realisees in vivo ont irus en evidence le r6le inhibi- 
teur exerce par le sous-type AT2 sur la proliferation des cellules musculaires 
de I'intima, apres lesion vasculaire (P. Janiak et al.. Hypertension, 1992, 20, 737- 
745 ; M. Nakajima et al., Proc. Natl. Acad. Sci. USA, 1995, 92, 10663-10667). 

Par ailleurs, la stimulation du recepteur AT2 active la phos- 
phatase SHP-1 (Bedecs K. et al; Biochem. /., 1997, 325, 449-454). Le fait que le 



recepteur AT2 active une phosphatase est en accord avec ses effets antiprolif^- 
ratifs. 

Compte tenu de ce qui pr6c6de, il a et€ montre que sur des 
cellules en culture, le r6cepteur AT2 : 
5 - inhibe la synthase d'ADN et la proliferation, induites par 

I'angiotensine II (Ang II) et le bFGF (M. Stoll et al., /. Clin. Invest, 1995, 95, 651- 
657), 

- induit Tapoptose (T. Yamada et al., Proc. Natl. Acad. Sci. USA, 
1996, 93, 156-160) et 

10 - induit la di£f6renciation neuronale (L. Laflamme et al., /. Biol 

Chem., 1996, 271, 22729-22735). 

L'etude des voies de signalisation, associ^es au r^cepteur AT2, 
a 6t6 abordee dans les cellules de la lign6e NlE-115, d6rivees d'un neuro- 
blastome murin, qui n'expriment que le sous-type AT2. Une premiere §tude a 

15 permis de mettre en Evidence une d6phosphorylation rapide et transitoire de 
certaines proteines sur residus tyrosine, suite au traitement des cellules NIE- 
115 par I'angiotensine II (C. Nahmias et al., Biochem. /., 1995, 306, 87-92). II a 
6galement 6te montr6 que le recepteur AT2 interfere avec les voies 
deactivation des rfecepteurs aux facteurs de croissance et inhibe I'activit^ des 

20 MAP kinases (ERKl et ERK2) {mitogen-activated protein), qui jouent un r6le cl6 
dans les ph6nom6nes de proliferation et de differenciation cellulaire. L'effet 
inhibitexir de l'AT2 sur I'activation des MAP kinases est rapide et transitoire, 
ne fait pas intervenir une prot6ine regulatrice sensible h la toxine pertussique 
(de type Gi/Go), mais implique I'activation d'une tyrosine phosphatase 

25 sensible k I'orthovanadate. 

Compte tenu du role du recepteur AT2 stir la proliferation 
cellulaire, les Inventeurs ont cherch6 k mettre au point des outils aptes k r6gu- 
ler Taction du recepteur AT2. En effet, I'activation du recepteur AT2 peut 
avoir des repercussions en canc6rologie (inhibition de la proliferation cellu- 

30 laire). 
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De manifere g^nerale, le r^cepteur AT2 presente des effets 
inverses de ceux de TATl sur Tactivation des MAP kinases et sixr la prolifera- 
tion cellulaire ; I'^tude de la communication qui peut exister entre ces detix 
sous-types de r^cepteurs, liant le m^me ligand, presente par consequent de 
5 rinter§t. 

L'etude des voies de signalisation et de la regulation du r^cep- 
teur AT2 repr6sente egalement un enjeu important pour la sant6 humaine 
sachant qu'aujourd'hui des antagonistes du recepteur ATI sont administres 
aux patients atteints d'hypertension. Dans ce contexte il devient essentiel de 

10 connaitre les effets biologiques associes au recepteur AT2 qui reste activable 
par r Ang II circulante dans ce type de traitement. 

La presente invention a pour objet un fragment d'acides 
nucieiques (ADN ou ARN) isole, codant pour une proteine apte k se lier au 
recepteur AT2, lequel fragment est selectionne dans le groupe constitue par 

15 les sequences SEQ ID NO:l, 3, 5, 7 et 9, telles que presentees dans la liste des 
sequences, incluse dans la presente Pemande. 

Ces differentes sequences correspondent k I'ADN compie- 
mentaire (ADNc) codant pour une partie ou la totalite de la proteine ci-aprfes 
denommee ATIP {AT2 interacting protein), 

20 La sequence SEQ ID NO:l (1803 pb) correspond k la sequence 

nucieique complete de TATIP de souris et inclut aussi bien les parties codant 
pour la proteine de liaison au recepteur AT2 que les parties non codantes. 

La sequence NO:3 (1323 pb) correspond k la sequence en 
acides nucieiques de la partie codante de la sequence SEQ ID NO:l, alors que 

25 la sequence SEQ ID NO:5 correspond au fragment de la sequence NO:l, 
obtenu par la technique du double-hybride (A. Plessis et al., M/S, 1994, 9, 1- 
IK ; J. Luban et al., Curr. Op. Biotechnol, 1995, 6, 59-64). 

La sequence SEQ ID NO:7 (3742 pb) correspond k la sequence 
nucieique complete de I'ADNc humain et inclut aussi bien les parties codant 

30 pour la proteine homologue de 1' ATIP de souris que les parties non codantes. 



La sequence SEQ ID NO:9 (1308 pb) correspond h la partie 
codante de la s6querice SEQ ID NO : 7. 

La pr6sente invention a §galement pour objet des transcrits, 
caract6ris6s en ce qu'ils sont compl6mentaires des sequences conformes k 
5 Tinvention et sont notamment g6n6r6s k partir desdites sequences. 

La pr^sente invention a en outre pour objet des fragments 
desdites sequences, utiles comme sondes ou comme zimorces, pour la detec- 
tion des sequences SEQ ID NO:l, 3, 5, 7 ou 9. 

Parmi lesdits fragments, on peut notamment citer une sonde 
10 de 354 pb, (SEQ ID NO:5) ainsi que tout fragment sup^rieur a 20 pb inclus 
dans les sequences SEQ ID NO:l, 3, 5, 7 ou 9. 

Comme amorce, on utilisera en particulier la sequence SEQ ID 
NO:10 (oligonucleotide antisens), qui permet notamment d'amplifier les 
parties 5' des differents ARNm correspondant k I'ATIP (techruque du 5' 
1 5 RACE : Marathon cDN A amplification kit, Clontech) . 

On peut egalement utiliser comme amorces d'amplification, 
tout couple d'oligonucieotides de plus de 20 pb et comprermnt une partie de la 
sequence nucieique ATIP (humaine ou de souris), notamment le couple SEQ 
ID NO:ll-SEQ ID NO:12. 
20 Les conditions preferees d'hybridation (prehybridation et 

hybridation) sont notamment les suivantes : 45 % formamide, 9 % Dextran- 
sulfate, 0,2 % BSA, 0,2 % polyvinyl pyrrolidone, 0,2 % Ficoll, 0,1 % sodiiim 
pyrophosphate, 0,01 % SDS, 0,05 mM Tris pH 7,5, 0,9 M NaCl et ringages 
jusqu'^ vine stringence correspondant au tampon : SSCXl, 0,1 % SDS. 
25 La presente invention a egalement pour objet une proteine 

purifiee et isoiee, denommee ATI?, apte k interagir avec le recepteiir AT2, 
selectiormee dans le groupe constitue par les sequences SEQ ID NO:2, 4, 6 ou 
8. 



Les sequences murines et hiimaine presentent 85,6 % 
d'homologies. La sequence humaine (ATIP humain) poss^de 5 aminoacides de 
moins que la sequence de souris (ATIP souris). Les acides aniin6s manquants 
dans la sequence humaine se situent au niveau des acides amines : 162, 163, 
5 164, 166 et 214 de la sequence ATIP souris. 

Les comparaisons (Blast) entre les sequences prot^iques ATIP 
selon I'invention et les sequences contenues dans les banques de donn^es 
indiquent que ATIP humain (comme ATIP souris), ne presentent jamais plus 
de 25 % d'homologie avec une sequence connue, et cela, seulement sur une 

10 partie de cette sequence. 

La pr6sente invention a ^galement pour objet un produit de 
traduction, caract6rise en ce qu'il est cod6 par une sequence nucl6otidique 
conforme k I'invention. 

La pr6sente invention a en outre pour objet des anticorps, 
15 caract6ris6s en ce qu'ils sont dirigfe contre la proteine ATIP ou un fragment 
de prot6ine ATIP selon I'invention. 

La pr^sente invention a 6galement pour objet un vecteur 
recombiiiant de clonage et/ou d'expression, caract^rise en ce qu'il comprend 
ime sequence nucl^otidique conforme k I'invention. 
20 La pr6sente invention a 6galement pour objet une cellule h6te 

transform6e, caract6ris6e en ce qu'elle comprend un vecteur tel que d^fini 
ci-dessus. 

Parmi les cellules transform^es pr6f6r6es selon I'invention, on 
peut citer E. coU et les cellules CHO. 

25 La pr^sente invention a 6galement pour objet des cellules 

h6tes transform6es, caract6ris6es en ce qu'elles sont coi«titu6es par xme 
souche de levtire convenable co-transf orm6e avec au moins deux vectexars qui 
cedent respectivement (i) pour une proteine dite appat s6lectionnee dans le 
groupe constitu6 par un fragment contenant au moins la SEQ ID NO:5 de la 

30 prot6ine ATIP et im fragment contenant au moins l'extr6mit§ C-terminale du 
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r^cepteur AT2, laquelle prot^ine appat est fusionn6e k une proteine 
selectionn6e dans le groupe constitue par le domaine de liaison a I'ADN d'un 
factetir de transcription et le domaine d' activation du meme facteur de trans- 
cription et (ii) pour line proteine dite proie, selectionn6e dans le groupe cons- 

5 titu6 par un fragment contenant au moins la SEQ ID NO:5 de la proteine 
ATIP, tm fragment contenant au moins I'extremite C-terminale du recepteur 
AT2 et tout autre polypeptide correspondant a une sequence contenue dans 
une banque d'ADNc, laquelle proteine proie est fusionnee k une prot6ine 
s61ectionn6e dans le groupe constitu6 par le domaine de liaison a TADN d'un 

10 facteur de transcription et le domaine deactivation du mfeme facteur de trans- 
cription, lesquels vecteurs comportent en outre des marqueurs de selection. 

Selon tm mode de realisation avantageux desdites cellules, 
elles sont notamment constitutes : 

- soit par une souche de levure convenable co-transform6e 

15 avec trois vecteurs qui codent respectivement pour (i) un appat correspondant 
k un fragment contenant rextr6mit6 C-terminale du recepteur AT2 fusionnt k 
une proteine s6lectionn6e dans le groupe constitu6 par le domaine de liaison i 
I'ADN d'un facteur de transcription et le domaine deactivation dudit facteur 
de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 

20 proteine ATIP selon Tinvention, fusionn6 k une proteine s6lectionn6e dans le 
groupe constitu6 par le domaine de liaison k I'ADN d'un factexir de transcrip- 
tion et le domaine d'activation dudit facteur de transcription et (iii) un poly- 
peptide correspondant a une sequence contenue dans une banque d'ADNc, 
lesquels vecteurs comportent en outre des marqueurs de selection, 

25 - soit par une souche de levure convenable co-transform6e 

avec deux vecteurs qui codent respectivement pour (i) un fragment contenant 
au moins la SEQ ID NO:5 de la prot6ine ATIP selon I'invention, fusionn6 k 
une prot6ine s6lectionnee dans le groupe constitu6 par le domaine de liaison k 
TADN d'un facteur de transcription et le domaine d'activation dudit factetir 

30 de transcription et (ii) un polypeptide correspondant k une sequence contenue 
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dans une banque d'ADNc, fusionn6 a une proteine s61ectionnee dans le 
groupe constitu^ par le domaine de liaison a I'ADN d'un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription, lesquels 
vecteurs comportent en outre des marqueurs de selection, 

5 - soit par vine souche de levure convenable co-trems£orm6e 

avec deux vecteurs, k savoir (i) un vecteur codant pour tin fragment contenant 
au moins la SEQ ID NO:5 de la proteine ATIP mut^e ou non, fusiorm6 k une 
prot6ine s6lectiorm6e dans le groupe constitu6 par le domaine de liaison k 
I'ADN d'un facteur de transcription et le domedne d'activation dudit facteur 

10 de transcription et (ii) un vecteur codant pour un fragment contenant 
I'extr^mit^ C-terminale du r6cepteur AT2 mut€ ou non, fusiorm6 k une 
proteine s6lectionn6e dans le groupe constitu6 par le domaine de liaison k 
I'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, lesquels vecteurs comportent en outre des marqueurs de 

15 selection, I'un des deux vecteurs codant obligatoirement pour une prot6ine 
mut6e. 

La pr6sente invention a egalement pour objet une m6thode de 
selection de proteines inhibitrices de I'interaction proteine ATIP selon 
I'invention-r^cepteur AT2, laquelle m6thode comprend : 

20 (a) la co-transformation d'xme souche de levure convenable 

avec trois vecteurs qui codent respectivement pour (i) im appSt correspondant 
k un fragment contenant I'exbremit^ C-terminale du r^epteur AT2 fusionn6 k 
une prot6ine selectiormee dans le groupe constitu6 par le domaine de liaison a 
I'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 

25 de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 
prot6ine ATIP selon I'invention, fusionn^ k une proteine s6lectionn6e dans le 
groupe constitu6 par le domaine de liaison k I'ADN d'lm facteur de tiranscrip- 
tion et le domaine d'activation dudit facteur de transcription et (iu) un poly- 
peptide correspondant k une s6quence contenue dans une banque d'ADNc, 

30 lesquels vecteurs comportent en outre des marqueurs de selection. 
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(b) la selection des clones de la banque d' ADNc exprimant un 
polypeptide inhibant Tinteraction r^cepteur AT2-prot6ine ATIP selon 
I'invention, sur un milieu s^lectif appropri6 et 

(c) I'identification dudit polypeptide. 

5 Une telle m6thode met notamment en oeuvre la technique dite 

du triple-hybride ou du double-hybride inverse, telles que d^crites dans Vidal 
et al. {Proc, Natl Acad. Sd. USA, 1996, 93, 10315-10320 et 10321-10326) ou 
Tirode et al. (/. Biol Chem., 1997, 272, 37, 22995-22999). 

La pr^sente invention a egalement pour objet une methode de 

10 criblage de polypeptides interagissant avec la prot^ine ATIP selon Tinvention, 
laquelle m6thode comprend : 

(a) la co-transfonnation d'une souche de levure convenable 
avec deux vecteurs tels que d6finis ci-dessus, k savoir qui codent respective- 
ment pour (i) un fragment contenant au moins la SEQ ID NO:5 de la prot6ine 

15 ATIP selon T invention, fusionn6 k une proteine s61ectionn6e dans le groupe 
constitu6 par le domaine de liaison ^ 1' ADN d'lm facteur de transcription et le 
domaine deactivation dudit facteur de transcription et (ii) un polypeptide 
correspondant k ime sequence contenue dans une banque d' ADNc, fusiorm6 k 
ime prot6ine s6lectionn6e dans le groupe constitue par le domaine de liaison k 

20 I'ADN d*un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, lesquels vecteurs comportent en outre des ntarqueurs de 
selection, et 

(b) la selection des clones exprimant im polypeptide interagis- 
sant avec la proteine ATIP, sur un milieu s6lectif convenable. 

25 Une telle m6thode permet notcimment de rechercher d'autres 

prot6ines interagissant avec la proteine ATIP, en particulier poxir trouver les 
maillons suivants de la voie activ6e par le r^cepteur AT2, en vue de les utiliser 
pour modifier I'interaction proteine selon Tinvention-recepteiir AT2. 

La presente invention a 6galement pour objet ime m6thode de 

30 caracterisation des domaines impliques dans Tinteraction proteine ATIP- 
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r6ceptexir AT2, caracterisee en ce qu'elle comprend : 

(a) la co-transformation d'une souche de levure convenable 
avec dexix vectetirs, tels que d6finis ci-dessxis, k savoir (i) un vecteur codant 
pour un fragment contenant au moins la SEQ ID NO:5 de la prot6ine ATIP 

5 mut6e ou non, fusionne k une prot6ine selectionn6e dans le groupe constitu6 
par le domaine de liaison k TADN d'un facteur de transcription et le domaine 
deactivation dudit facteur de transcription et (ii) un vecteur codant poiir un 
fragment contenant I'extr^mite C-terminale du recepteur AT2 mute ou non, 
fusionn^ a une proteine selectionnee dans le groupe constitu6 par le domaine 

10 de liaison k VADN d'un facteur de transcription et le domaine deactivation 
dudit facteur de transcription, lesquels vecteurs comportent en outre des 
marqueurs de selection. Tun des deux vecteurs codant obligatoirement pour 
une proteine mut6e et 

(b) la visualisation, par selection sur un milieu s61ectif conve- 
15 nable, de la perte 6ventuelle de Tinteraction ATIP-recepteur AT2. 

Une telle m6thode permet d'identifier et de d6linuter les 
domaines importants de la proteine ATIP ou de I'extremit^ C-terminale du 
recepteur AT2, dont depend leur interaction, afin de les utiliser comme cible 
privil6gi6e pour modifier la signalisation du recepteur AT2. 
20 La pr6sente invention a egalement pour objet une methode de 

selection de substances aptes k influencer Tinteraction proteine ATIP selon 
rinvention-r6cepteur AT2, laquelle m6thode comprend : 

(a) la mise en contact de la proteine ATIP fixee sur im support 
avec ime proteine de fusion recepteur AT2-prot6ine etiquette, eventuellement 

25 en presence d'une substance k tester, 

(b) au moins tm lavage dudit support ainsi traite avec im 

tampon convenable et 

(c) la visualisation de I'eventuelle interaction ATIP-r6cepteur 
AT2, en particulier en SDS-PAGE, suivie d'une immuno-empreinte avec des 

30 anticorps dirig^s soit contre la proteine etiquette, fusionnee au recepteur AT2, 
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soit centre le r^ceptexir AT2. 

Si la substance k tester inhibe Tinteraction ATIP-r6cepteur 
AT2, r^tape de visualisation est negative. 

Con£orm6ment h Tinvention T ATIP est £ix6e sur ledit support 
5 soit de mani6re covalente, soit par liaison d'affinit6 entre une substcince de 
fixation fusionn6e k TATIP et ledit support. Par exemple, ledit support est 
constitu6 de billes coupl6es, soit ^ xine substance pr^sentant une a£finit6 avec 
ladite prot6ine de fixation, fusionn6e ^ TATIP, soit k des anticorps conve- 
nables. 

10 La prot6ine de fusion r6cepteur AT2-prot§ine etiquette est 

notamment obtenue k partir d'un lysat de cellules transfect^es avec un vecteur 

exprimant la prot6ine de fusion AT2-prot6ine Etiquette, 

En variante, ladite m^thode de selection de substances aptes k 

interagir avec la prot6ine ATIP selon Tinvention, comprend : 
15 (a) la mise en contact de la prot6ine ATIP fix6e sur un support, 

avec un lysat cellulaire, 

(b) au moins un lavage dudit support ainsi traite avec ton 
tannpon convenable, 

(c) la visualisation de Teventuelle proteine associ6e k la 
20 prot6ine ATIP, en particxilier en SDS-PAGE, sxiivie d'une immuno-empreinte 

avec des anticorps appropri6s et 

(d) I'identification de la proteine du lysat cellulaire interagis- 
sant avec la prot6ine ATIP. 

Confonn6inent k ladite methode de selection de substances 
25 aptes k influencer Tinteraction prot6ine ATIP selon Tinvention-rteepteur AT2, 
il est possible d'utiliser notamment comme prot6ines de fusion ATIP-proteine 
etiquette, les prot6ines GST-ATIPc et MYC-ATIPc, qui constituent des outils 
pouvant permettre d'entrainer in vitro d*6ventuelles prot^ines interagissant 
avec ATIP, par exemple, k partir de lysats cellulaires activ6s ou non par des 
30 ligands du r6cepteur AT2. La proteine GST-ATIP peut-Stre entrain^e par 
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interaction sp6cifique du GST avec des billes d'agarose couplees k de la gluta- 
thione, ou encore immunoprecipitee avec I'anticorps anti-ATIP. La prot6ine 
Myc-ATIP peut-etre immunoprecipitee avec les anticorps anti-MYC commer- 
ciaux ou avec I'anticorps anti-AHP. 

L'interet de ces m6thodes consiste k trouver des moyens de 
modifier la signalisation, le niveau d'expression ou la pharmacologic du 
recepteur AT2, ceci pouvant avoir des applications th^rapeutiques. En effet 
lorsqu'une pathologie aura 6te correlee de faqon claire k une anomalie de la 
transduction associee au recepteur AT2, une modification de cette transduc- 
tion, en particulier en jouant sur la liaison du recepteur AT2 k la prot^ine 
selon I'invention, pourra alors eventuellement compenser le d^sordre patho- 
logique ou au moins I'influencer. 

La presente invention a 6galement pour objet Tutilisation des 
cellules co-trarisform&es pr6cit6es, pour la selection et le criblage de 
substances ou de proteines aptes k influencer I'interaction prot6ine ATIP- 
r6cepteur AT2 ou aptes k interagir avec la prot6ine ATIP. 

Outre les dispositions qui precedent, I'invention comprend 
encore d'autres dispositions, qui ressortiront de la description qui va suivre, 
qui se r6f6re k des exemples de mise en oeuvre du proc6d6 objet de la presente 
invention ainsi qu'aux dessins armex6s, dans lesquels : 

- la figure 1 correspond a I'extremite C-terminale du recepteur 
AT2 de souris, utilis^e comme appat en double hybride pour cribler une 
banque d' ADNc de souris ; 

- la figure 2 illustre la position du domaine de liaison G AL4 et 
le site de clonage multiple du plasmide pGBT9 (Qontech) ; 

- la figxire 3 illustre les structures pr6sum6es coiled-coil 
(surenroul6es) (domaines coiled-coil soulign6s) de 1' ATIP de souris ; 

- la figure 4 illustre les structures presum6es coiled'Coil 
(surenroulees) (domaines coiled-coil soulign6s) de 1' ATIP humaine ; 

- la figure 5 illustre la structure du plasmide pVP16 ; 
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- la figure 6 illustre le site de clonage multiple du plasixiide 

pRSET A ; 

- la figure 7 illustre la sequence MYC utilisee, pour construire 
le plasmide pcDNA3-MYC ; 

5 - la figure 8 illustre la structure du plasmide pBAC-PAK-poly 

HIS, 

- la figure 9 illustre un Northem blot de plusieurs tissus 
humains hybrid6s avec la sonde ATIPsouris-court (SEQ ID NO:5) ; 

- la figure 10, illustre Tinteraction in vitro de la prot6ine 
10 ATIPsouris-court avec Textremite C-terminale du rScepteur AT2 ; et 

- la figure 11 illustre les modifications du signal induit par le 
recepteur AT2 par surexpression de la proteine ATIP. 

II doit Stre bien entendu, toutefois, que ces exemples sont 
donn6s uniquement k titre d'illustration de I'objet de Tinvention, dont ils ne 
1 5 constituent en aucune manifere une limitation. 

EXEMPLE 1 : Mise en evidence d'une interaction proteine-proteine sp6ci- 
fique entre le recepteur AT2 et la proteine de sequence SEQ ID NO:6 selon 
rinvention. 

Materiel et methodes 

20 - Le syst6me double-hybride, initialement d6velopp6 par Song 

et Fields en 1989 (Nature, 340, 245-246) repose sur le fait que Tactivit^ de 
nombreux facteurs activateurs de transcription eucaryotes ne n^cessite que 
deux domaines : un domaine activateur qui n'a pas la capacity de lier TADN 
et un domaine de liaison k T ADN. 

25 Dans le syst^me double-hybride, le domaine de liaison de 

r ADN est fusionne k une proteine X et le domaine d'activation est fusionn6 k 
une proteine Y, Si, et seulement si, X et Y interagissent, un complexe est f orm6 
qui reconstitue un facteiur de transcription fonctionnel. 
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- Construction des vecteurs d' expression : 
. vecteurs « appSts »: 

Prot^ine X : extremite C-temninale de la sequence codant pour 
le r6cepteur AT2 de souris (52 aminoacides de CVNPF au codon stop, voir 
5 figure 1), fusionn^e a la sequence codant pour le doniaine de liaison k I'ADN 
de Gal4 (figure 2). 

Insert : extr6mit6 du r6cepteur AT2 de souris (159 pb + 16 pb 
de sites g6n6r6s par PGR) ins6r6 au niveau des sites EcoRI et BamHI des 
vecteurs pLEX9 (Qontech) ou pGBT9 (pBTM116 ou pGAD424 modifi6; A.B. 
1 0 Vojtek et al.. Cell, 1993, 74, 205-214). 

On obtient ainsi la sequence suivante : 
CGGAATTC cot6 5'-AT2 sequence C-terminale de 52 acides anun6s- 
GGATCCCG cot6 3' 

. Banque cribl6e : 

15 Banque d'ADNc de foetus de souris (A.B. Vojtek et al.. Cell, 

1993, 74, 205-214), contenant des inserts de 350 k 700 pb (proteine Y) dans le 
vectexir VP16 (figure 5). 

. Vecteurs contrdles « appats » 

Proteine X : extr^mit^ C-terminale des riceptetirs p2- 
20 adr6nergique humain, AH de rat ou bradykinine humain. 

. Souche de levtire transfonn6e 

HF7c (Clontech) pour I'appat construit dans pGBT9 ; 

L40 pour I'appit construit dans pLex9. 

R^sultats 

25 Cette strategic a permis d'isoler un clone issu de la banque 

d'ADNc contenant un insert de 354 pb (ATIP) qui interagit de fagon sp6cifique 
avec I'extr6iiut6 C-terminale de l'AT2. II est interessant de noter que le 
criblage de cette banque avec les constructions r6alis6es dans les deux 
vecteurs d'expression pGBT9 et pLEX9 a permis de retrouver dans les deux 

30 cas ce m^me clone. Ce clone n'interagit pas avec des prot6ines contrdles. 
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d'interactions non sp6cifiques. 

Pour juger de la selectivity de cette interaction, le clone ATIP a 
ete teste en double-hybride avec les extr6mites C-terminales des recepteurs : 
p2 adr6nergique humain, ATI de rat et bradykinine humain, et toutes ont 
5 donn6 des r^sultats n6gatifs. Ceci indique que le polypeptide cod6 par le clone 
ATIP interagit, de fagon selective, avec Textr^mite C-terminale du recepteur 
AT2 de souris. 

EXEMPLE 2 : Caracterisation du clone ATIP. 

Pour rechercher le clone entier correspondant, une sonde de 

10 354 pb (SEQ ID NO:5), qui correspond k I'insert obtenu par digestion avec 
r enzyme de restriction NotI du plasmide isole en double hybride (celui extrait 
de la banque VP16, selectionn6 comme positif dans le crible utilisant comme 
appat, rextr^mite C-terminale du recepteur AT2 de souris), est utilis§e pour 
cribler une banque d'ADNc de foetus de souris construite avec des inserts de 

15 taille sup6rieure k 1 kb. Deux clones chevauchants, comprenant la sequence 
ATIP, ont ainsi 6t6 identifies et ont permis de sequencer 1803 pb de I'ADNc 
correspondant (SEQ ID NO:l). Cette sequence contient une phase ouverte de 
lecture de 1323 pb (SEQ ID NO:3) codant potentiellement pour une prot6ine 
de 440 acides anrunes (SEQ ID NO:2 et 4). Les comparaisons entre la sequence 

20 prot^ique identifi6e et les sequences contenues dans les banques de donn^es 
indiquent que celle-ci ne presente jamais plus de 25 % d'homologie avec une 
partLe d'lme sequence connue. 

La sonde de 354 pb (SEQ ID NO:5) a 6te utilisee comme sonde 
en Southern et Northern de fagon tr^s satisfaisante dans les conditions 

25 d'hybridation ci-apr6s : pr^hybridation et hybridation en 45 % formamide, 9 % 
Dextran-sulfate, 0,2 % BSA, 0,2 % polyvinyl pyrrolidone, 0,2 % FicoU, 0,1 % 
sodium pyrophosphate, 0,01 % SDS, 0,05 mM Tris pH 7,5, 0,9 M NaCl et 
rin?ages jusqu'^i stringence : SSCXl, 0,1% SDS . 

En parall6le, des experiences d'hybridation de Northern blot 

30 effectu6es sur des ARN totaux de cellules NlE-115 avec la sonde ATIP (SEQ 
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ID NO:5) confirment I'expression de I'ARNm correspondant dans les cellules 
NlE-115, et indique I'existence d'au moins 5 transcrits de taUles diff6rentes. 
Ces transcrits correspondent a des 6pissages altematifs d'un mgine g6ne ou a 
des g^nes differents homologues. 

Sur un Northern, e£fectu6 dans les conditions decrites dans la 
litterattire sur un 6chantiUon de 5 ng d'ARN poly A+ de cellules NlE-115, les 
tailles des dif£6rents trar^crits hybridant avec la sonde ATIPsouris sent = 2,5- 

3,5-5-5,3 et 7,5 kb. 

La figure 9 represente un Northern blot conteriant des ARN 
poly A+ de differents tissus htimains, hybrid6s avec la meme sonde 
ATIPsouris. On peut constater que I'ATIP est exprime de iaqon ubiquitaire. 
On trouve dans tous les tissus repr6sentes un transcrit majoritaire k kb, 
auquel s'ajoute, selon les tissus, d'autres transcrits plus longs (pancreas et 
coexir) ou plus courts (pancreas, muscle squelettique, placenta, cerveau et 
cceur). Ceux-ci sont peut-6tre le fruit d'un 6pissage altematif de I'ARN de 
ATIP qui serait dependant du tissu consider^ ou encore ils sont le signe de 
I'existence d'une famille d'ARN codant pour des prot^ines de "la famille 
ATIP", homologues de ATIP et qui sont r§v6l6s par la sonde, h la stringence 
utilis6e. 

Afin de connaitre la taille du plus petit transcrit codant pour 
I'ATIP, une amplification rapide des extremit^s d'ADNc (RACE 5', Marathon 
cDNA Amplification Kit de Clontech) partir d'ARN poly A+ de cellules NlE- 
115 a 6t6 r6alis6, en utilisant roligonucl6otide antisens de SEQ ID NO:10, pour 
amplifier les parties 5' des differents ARNm correspondant k I'ATIP endog^ne 
des cellules NlE-115 (nexiroblastome murin). 

Les r^sultats obtenus ont indiqu6 que le plus petit transcrit 
incluant le domaine ATIP est im ARNm de 1950 pb, qtai contient bien le d6but 
de la sequence codante obtenue par clonage. 

Tout autre couple d'oligonucl6otides (amorces) de plus de 20 
pb et comprenant une partie de la sequence ATIP, peut 6galement dtre utilise 
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pour amplifier par PCR (conditions de PCR k determiner pour chaque couple 
d'oligonucl6otides k Vaide du logiciel OLIGO 4) une partie de I'ATIP (et 
donner un fragment d'ADN qui pourrait ^ventuellement Stre utilise comme 
sonde pour reconnaitre 1' ADN ou TARN correspondant k I'ATIP). 
5 EXEMPLE 3 : Construction de diff erents vecteurs selon Tinvention 

D'une fagon generale les vecteurs contenant ATIPsouris-court 
(k I'exception de pRSETA-ATIPsouris-court) ont ete obtenus k partir d'lm 
insert produit par PCR avec les deux oligonucleotides suivants (SEQ ID 
NO:ll et SEQ ID NO:12): 
10 oligo. sens: 5' CGCGGATCCCAGACAGACCGGACGGAACTGGAG 3' 
oligo. antisens: 5' CCGGAATTCACTACAACCrTTCGTTTAAAGCATC 3*, 

en utilisant comme matrice le vecteur VP16- ATIPsouris-court 
(figure 5). Par commodity, ce vecteur est denonune BATIPcStop,E^ effet, 
digere par BamHI et EcoRI, il donne un insert correspondant k la sequence 

15 

ler brin: GATCC-SEQ ID NO:5 (moins CAT) -TAGTG 

2erae brin: CCTAG CTTAAG 

(STOP) 

Site BamHI Site EcoRI 

20 

D'autres vecteurs peuvent 6galement gtre construits ; ils 
comprennent tout ou partie de la proteine ATIP et sont les suivants : 

-VP16-ATIPsoxxris-court (vecteur sorti de la banque criblee en 
double hybride, comprend 354 pb (SEQ ID NO:5), inser6es en Nod dans 
25 VP16). 

-pCDNAS-MYC-ATIPsouris-court (insert ^ATIPcStop^E. 
ins6r6 en BamHI-EcoRI dans pCDNA3-MYC (pcDNA3 dTnvitrogen, modifie 
par iitsertion de la sequence MYC, figure 7) ; ce plasmide peut gtre utilis6 en 
transfections stables ou transitoires. II permet d'exprimer MYC-ATIPsouris- 
30 court en cellules eucaryotes. L'expression de cette proteine dans des cellules 
eucaryotes aprfes transfection du plasmide correspondant a dej^ ete obtenue et 
v6ri£i6e par immunor^action avec un anticorps anti-MYC et anti-ATIP. 
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-pRSETA-HIS-ATIPsouris-court (insert ^ATIPcStoP/E. ins6r6 
en BamHI-EcoRI dans pRSETA, Invitrogen). Ce plasmide permet d'exprimer 
la prot6ine de fusion HIS-ATIPsouris-court en cellules bacteriennes et de la 
purifier sur colonne de Nickel (Voir figure 6 pour le site multiple de clonage). 

5 .pBacPAK-polyHIS-ATIPsouris-court (insert ^ATIPcStop^E. 

insure en BamHI-EcoRI dans le vecteur pBacPAK-polyHIS (pBacPAK 
conunercial, modifi6 par insertion d'une sequence contenant un tag histidine 
et un site de clivage a la thxombine, figure 8). Cette construction peut etre uti- 
lis6e pour exprimer la proteine ATIP souris-court, fusionnee a un tag histi- 

10 dine, dans des cellules d'insectes (type SF9). En effet, conune il est indique, ce 
vecteur contient une insertion poly-histidine et peut done coder pour la 
prot6ine de fusion. Celle-ci, de meme que la proteine de fusion clon6e dans 
pRSET, peut-etre purifiee sur colonne de Nickel et servir au m&i\e type de 
techniques. 

15 -pGEX-4Tl-GST-ATIPsouris-court (insert aniplifie par PGR 

identique k B ATIPcStop,E, mais sans codon STOP, ce qui prolonge la sequence 
de ATIPsouris-court des quelques acides amines suivants: Phe-Glu-Phe-Pro- 
Gly-Arg-Leu-Glu-Arg-Pro-His-Arg-Asp provenant du plasmide pGEX-4T-l 
(Pharmacia). Ce plasmide permet d'exprimer la proteine GST-ATIPsouris- 

20 court en cellules bacteriexmes et de la purifier sur billes glutathion-agarose. 

-pCDNAI-ATIPsouris clonal (totality du 5' s6quenc6 de ATIP 
et ORF jusqu'^ pb: 1205 en partant du d&but du clone, ins6r6 en Bstxl dans 
pCDNAI). Ce plasmide est issu du clonage de la banque de foetus de souris 
avec la sonde SEQ ID NO:5. Ce plasmide peut servir produire en bact6ries, 

25 la portion 5' de T ADN ATIPsouris, pour Tutiliser conune sonde, 

-pCDNAI-ATIPsoxiris clone 2 (26me moiti6 de TORE de ATIP 
a partir de pb: 616 et jusqu'a la fin du 3* sequence (pb 1803), ins6r6 en Bstxl 
dans pcDNAI, Invitrogen). Ce plasmide peut servir k produire en bact6ries, la 
portion 3' de T ADN ATIPsouris, pour Tutiliser comme sonde. 

30 -pcDNAI-ATIPsouris-long (clones 1 et 2 mis bout k bout, en 
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utilisant le site interm6diaire Sapl. Ce plasmide contient la totality du done 
ATIP soviris, ins^r^ en Bstxl dans pCDNAI). Ce plasmide peut gtre utilise en 
transfections transitoires en cellules eucaryotes. 

-pcDNA3-ATIPsouris-long (ATIPsouris entier sorti BamHI- 

5 Xbal de pCDNAI-ATIPsouris-long, et ins§r^ dans pcDNA3, Invitrogen, ^ ces 
m§mes sites). Ce plasmide peut 6tre utilise en transfections stables ou transi- 
toires en cellules eucaryotes. II a permis de traduire in vitro (kit TNT T7 
coupled reticulocytes lysate systems, Promega) la proteine ATIP enti^re et de 
constater que son produit de traduction a un poids moleculaire apparent sur 

10 gel de 58 kDa. A ce produit majoritaire s'ajoute deux produits minoritaires de 
30 et 15 kDa. D'aprfes la sequence de ATIP, ceux-ci pourraient correspondre a 
des produits partiels de traduction in vitro commengant ^ d'autres ATG que 
celui en position 178 de la SEQ ID NO:l. 

EXEMPLE4 : Obtention de clones stables exprimant la proteine ATIPsouris- 
15 court ou long. 

On a obtenu par transfection des clones stables exprimant k la 
fois le r6cepteur AT2 humain et I'ATIP souris court (SEQ ID NO:6) ou 1' ATIP 
souris long (SEQ ID NO:3). 

Les cellules CHO, d6ficientes en dihydrofolate reductase, sont 

20 transfectees avec un plasmide contenant la region codant pour le recepteur 
AT2 hTimain (Bedecs et al., Biochem. J. 1997, 325, 449-454). 

Le clone s6lectionn6, CHO-hAT2, exprimant 100 fmol de 
recepteur AT2/mg de proteine, est cultiv^ sur milieu HAMF12 complements 
avec du s6rum de veau f cetal ^ 10 % et utilise entre les passages 10 et 30. 

25 Ce clone a ltd m^me 6t6 transfectS avec les plasmides 

pCDNA3-MYC-ATIPsouris-court ou pCDNA3-ATIPsouris-long d6crits k 
I'exemple 3. La selection des clones exprimant, de mani^re stable, la proteine 
ATIP (forme courte ou forme longue) s'est faite en milieu s6lectif contenant 
800 Jig/ml de G418. Les lysats cellulaires, correspondant aux diff6rents clones 

30 s6lectionnes, ont 6t6 soumis k un SDS-PAGE suivi d'tme immuno-empreinte et 
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celui-ci a et6 incub6 avec Tanticorps polyclonal anti-ATIP. Les r6sultats obte- 
nus indiquent que diff^rents clones exprimant des taux differents d'ATIP 
souris court, ont pu &tre obtenus. 

EXEMPLE 5 : Production d'anticorps polyclonaux diriges contre la sequence 
5 SEQ ID NO:6. 

Afin de progresser dans la caracterisation de ce clone, la pro- 
duction d'anticorps polyclonaux dirig6s contre le dontaine ATIP a 6t6 entre- 
prise. 

Pour cela, un vecteur codant pour une proteine correspondant 
10 k ce domaine fusionne k six r6sidus histidine a 6te construit. 

La sequence suivante : 
GGA TCC-SEQ NO:5-TAG-TG A-ATT 
est ins6r6e dans le plasmide pRSETA, tel que defini ci-dessus. 

Dans cet insert, la SEQ ID NO:5 ne comprend pas le premier 

15 CAT. 

Le plasmide obtenu est exprime dans la souche d'E. coli BL 21 
(DES) (F- ompT- rs' mB") contenant le bacteriophage DES qui porte un frag- 
ment d'ADN contenant le g6ne lad, le promoteur lacUVS, le debut du gfene 
lacZ et le g6ne codant pour la T7 ARN polymerase. Ce fragment est introduit 
20 dans le g6ne int 

En presence de DES, seul le promoteur lacUVS, inductible par 
IPTG dirige la transcription de la T7 ARN polymerase. 

L' addition de 0,4 mM d'IPTG ^ tine culture de cellules BL21 
(DES) induit la production de T7 ARN polymerase qui, k son tour, entraine la 
25 transcription de 1' ADN cible du plasmide pRSETA (permettant la traduction 
de la proteine se liant au recepteur AT2). 

La proteine obtenue (17 kDa) est purifiee sur coloxme de 
Nickel (Ni-NTA, QuiAexpressionist 07/97, Quiagen), grace k I'af finite de ses 
six residus histidine pour le ruckel. La proteine obtenue est ensuite injectee ^ 
30 des lapins pour obtenir des anticorps polyclonaux diriges contre la proteine 
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ATIP. Les saign6es obtenues pr6sentent un trfes bon titre. 

Ces anticorps purifies sur colonne de GST-ATIP, apr^s 
passage sur colonne de GST seul (afin d'^liminer les 6ventuels anticorps sp6ci- 
fiques de GST et de ne retenir sur la colonne de GST- ATIP que les anticorps 
5 sp6cifiques de ATIPsoxiris-court) peuvent etre utilises avec succfes pour 
immuno-pr6cipiter et r6v6ler en inununo-empreinte MYC-ATIPsotiris-court k 
partir de cellules COS transfect6es de fagon transitoire. De plus cet anticorps 
ptirifie r6v6le 6galement en immuno-empreinte la proteine ATIPsouris-long 
contenue dans des lysats de cellules COS transitoirement transfect6es avec le 
10 plasmide pCDNA3-ATIPsouris-long. 

La prot6ine ATIPsouris-long transfect6e est visualis6e apr^s 
SDS-PAGE et inununo-empreinte avec un anticorps anti-ATIP, sous la forme 
de deux polypeptides de poids moleculaires apparents de 50 et 45 kDa. 

Cet anticorps pxxrifie a 6t6 utilise en immuno-fluorescence sur 
15 des ceUules CHO-hAT2, fix6es par im traitement de 15 minutes en para- 
formaldehyde (3 %). Apr6s fixation, les cellules sont trait^es successivement 
par des solutions de PBS/ glycine 50 mM pendant 20 minutes, PBS/Triton 
XlOO 0,1 % pendant 5 minutes et PBS/BSA 0,2 % pendant 15 minutes. Elles 
sont ensuite incub6es successivement dans des solutions k 15 ng/ml 
20 d'anticorps contenant I'anticorps anti-ATIP purifi6, puis I'anticorps anti- 
immunoglobuline de lapin couple k de la rhodamine pendant 30 minutes. 
Entre chaque nouvelle incubation, trois ringages en PBS sont effectu6s. Les 
observations au microscope k fluorescence indiquent une expression de la 
prot6ine ATIP endog^ne au niveau du noyau (de fagon majoritaire) et du 
25 cytoplasme des cellules CHO-hAT2. 

Certaines cellules montrent une repartition homog^ne de la 
fluorescence due k I'anticorps anti-ATIP dans ces compartiments, alors que 
d'autres cellules qui paraissent plus etal^es, montrent ime repartition h6t6ro- 
gene de la fluorescence le long de filaments qui semblent partir du noyau et 
30 s'etendre jusqu'^ la membrane plasmique de la cellule, en un reseau organise. 
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Des experiences compl^mentaires de co-localisation doivent etre effectu6es 
pour determiner si ces filaments coincident ou non avec des structxires 
connues du cytosquelette. 

EXEMPLE 6 : Confirmation de Tinteraction in vitro de la proteine 
ATIPsouris-court avec Textremite C-terminale du recepteur AT2. 

Pour d6montrer Tinteraction de la proteine ATIPsouris-court 
avec Textremite C-terminale du recepteur AT2 dans xm autre systfeme que 
celui du double hybride, im protocole permettant de mettre en Evidence cette 
interaction in vitro a ete mis en place. Pour cela, la proteine de fusion GST- 
ATIP telle que decrite ci-dessus a et6 produite ; elle est associee par sa partie 
GST k de la glutathione coupl6e k des billes d'agarose (GA). En parall^le, des 
bacteries (DH5a) sont transfectees avec im plasmide (pMAL-c2-AT2, issu de 
pMAL-c2 de New England Biolabs) codant pour une proteine de fusion entre 
I'extremite C-terminale du recepteur AT2 humain (Asn314-Ser363) et la MBP 
(Maltose Binding Protein). Ces bacteries ont ete cultivees et la proteine de 
fusion a ete induite en IPTG 0,3 mM selon le protocole "pMAL Protein Fusion 
and Purification System'' de New England Biolabs. Aprfes centrifugation de la 
culture k 4 000 g et solubilisation du cidot obtenu en "column buffer'' (20 mM 
Tris-HCl, 200 mM NaQ, 1 mM EDTA), une nouvelle centrifugation ^ 9 000 g a 
permis de recuperer un surnageant contenant une forte concentration de 
MBP-AT2. Ce surnageant a ete mis en contact, pendant 3 heures k 4*'C, avec 
les billes de glutathione agarose coupiees k la proteine GST seule apr^s addi- 
tion de NaCl de fagon k se placer k 300 mM final NaCl. Cette 6tape de prein- 
cubation permet d'eliminer les interactions non specifiques qui peuvent exis- 
ter entre ATIP et GA-GST. Le sximageant recupere a 6te mis en contact avec 
les billes GA-GST- ATIPsouris-court ou GA-GSTsexil pendant une nuit ^ 4*'C. 
Apres contact les billes ont ete rincees 3 fois en tampon 20 mM Tris-HCl, 
300 mM NaCl, 1 mM EDTA et ime fois en "column buffer". Apr^s analyse des 
billes rincees en SDS-PAGE et immuno-empreinte avec xm anticorps anti-MBP 
(New England Biolabs), on observe une retention specifique de la proteine 
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MBP-AT2 sur billes GA-GST-ATIPsouris-court qui n'est pas observ^e sxir les 
billes GA-GSTseul (Figure 10). 

Ce meme protocole a 6t6 r6alis6 avec un plasmide exprimant 
MBP-ATl (extr6mit6 C-terminale du r6cepteur AH humain (Leu297-Glu359)) 

5 et indique que la prot6ine MBP-AH n'est pas retenue de iaqon sp6cifique sur 
les billes GA-GST-ATIPsouris-court (Figure 10). 

Ces r^sultats confirment ceux obtenus en double hybride 
indiquant une interaction sp6cifique et selective entre la prot6ine selon 
I'invention et I'extrinut^ C-terminale du r6cepteur AT2 ( et pas ATI). 

10 EXEMPLE 7 : Modification de la transduction du signal du r^cepteur AT2 
dans des clones surexprimant la proteine ATIPsouris-long. 

Afin de verifier que la proteine ATIP interagit in vivo avec le 
r^cepteur AT2, on a ^valu6 si une une surexpression de cette prot6ine modifie 
un signal induit par le r6cepteur AT2. 

15 Pour cela un clone stable de cellules CHO-hAT2 exprimant la 

proteine ATIPsouris-long (CHO-hAT2-ATIP), obtenu selon la m6thodologie 
d^crite dans I'exemple 4 a 6te utilis6 ; le test fonctionnel de l'activit6 du r^ep- 
teur AT2 mis au point sur le clone CHO-hAT2 qui consiste a inhiber la 
phosphorylation de la sous-unit6 IRp du r^cepteur de I'insuline induite par 

20 son ligand, a 6t6 reproduit. 

Mise en Evidence d'une inhibition par le r^cepteur AT2 de la 
phosphrylation d'IR|3 induite par I'insuline dans les cellules CHO-hAT2 : 

Les cellules CHO-hAT2 sont ensemenc§es k une density de 
3.10* cellules par boite de 15 cm2 de diam6tre. Biles sont rendues quiescentes 

25 par un sevrage de 16 heures avant d'etre trait^es. Le traitement consiste en 
une mise en contact de 5 minutes avec 15 ml de milieu F12 contenant de 
I'insuline additionn^ ou non de CGP42112 (agoniste s6lectif du r6cepteur 
AT2). Apr6s traitement, les cellules sont solubilis6es en tampon de lyse conte- 
riant : 50 mM Hepes, pH 7.6, 1 % Triton X-100, 20 mM EDTA, 30 mM pyro- 

30 phosphate de sodium, 30 mM fluorure de sodium, 2 mM benzamidine, 1 mM 
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sodium ortho vanadate, 1 mM fluorure de ph6nylmethylsuphonyle et 1 |ig/ml 
d'aprotinine, pepstatine, antipaine and leupeptine. Les lysats sont ensuite 
souinis k une purification sur colonne de lectine de germe de bl6 selon le 
protocole d^crit dans Issad, T., et al, (Eur. /. Biochem. 1995, 234, 108-115). Apr^s 

5 mise en contact et lavages, les bUles de lectine couplee a de la s^pharose 
(Pharmacia) sont reprises dans du tampon d'6chantillon contenant du SDS et 
les proteines eluees sont analysees en SDS-PAGE suivie d'immuno-empreintes 
avec des anticorps anti-phosphotyrosine (Upstate Biotechnology, Inc.) ou anti- 
IRP (d6crit dans Issad, T., et al., precite). 

10 La sous-unite p du r6cepteur de I'insuline apparait coirune un 

polypeptide de 97 kDa dont la phosphorylation (visualisee par revelation avec 
un anticorps anti-phosphotyrosine) augmente de faqon dose-dependante avec 
la concentration en insuline. Uangiotensine II (100 nM) ainsi que le CGP42112 
(100 nM) inhibent cette phosphorylation a toutes les doses d'insuline testees 

15 entre 0,1 et 0,001 ng/ml (Figure 11). A titre d»exemple, le CGP42112 inhibe la 
phosphorylation de IRP induite par 0,01 ng/ml d'un facteur 64 + 4 % (n=7). Ce 
resultat demontre que le r6cepteur AT2 interfere n^gativement sur les voles 
de signalisation du r6cepteur de I'insxiline k T^tape initiale de son activation, 
qui est son autophosphorylation. Ces resultats fournissent egalement la 

20 premiere mise en evidence d'une intercormection entre les voies de signalisa- 
tion des r^cepteurs tyrosines kinases et le r^cepteur k sept domaines trans- 
membranaires qu'est T AT2. 

Reproduction de cette methodologie sur les cellules 
CHO-hAT2-ATIP : 

25 Lorsque ce protocole est realist sur des cellules 

CHO-hAT2-A'nP, Pinhibition par le CGP42112 (100 nM) de la phosphoryla- 
tion du r6cepteur de I'insuline obtenue pour differentes doses d'insxiline (0,05, 
0,01, 0,005, 0,001 |ig/ml) n'est pas observee (Figure 11). Ce resultat a 6t6 
reproduit 3 f ois pour chacune des doses d^insuline en prenant conune contrdle 

30 positif, dans chaque experience, I'inhibition obtenue pour le clone CHO-hAT2. 
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Ceci d^montre done que la surexpression de la prot6ine ATIP 
dans les cellules CHO-hAT2 interfere avec la signalisaidon du r6cepteur ATI, 
ce qui confirme I'interaction in vivo de la proteine ATIP avec le r^cepteur AT2. 

Une autre proteine glycosyl6e, retenue sxir colonne de lectine, 

5 ayant un poids apparent de 120 kDa, identifiee comme 6tant la proteine 
nouvellement clon6e SIRP (Kharitonenkov, A. et al. Nature, 1997, 386, 181- 
186) est phosphoryl6e sur tyrosine en r^ponse a I'insuline. La phosphorylation 
de cette proteine, de mgme que celle de IRp est iiJiib^e en presence de 
CGP42112 dans le cas du clone CHO-hAT2 et ne Test pas dans le cas du clone 

10 CHO-hAT2-ATIP. Ceci confirme que la proteine ATIP interfere sur les voies 
de signalisation du r6cepteur AT2. Ces resultats montrent bien Pint^r&t que 
peut presenter TutUisation de la proteine ATIP pour modifier la signalisation 
m6di6e par le r6cepteur AT2 et compenser 6ventuellement des pathologies 
associees a des anomalies de la regtdation de ce r^cepteur. 

15 Ainsi que cela ressort de ce qui precede, Tinvention ne se 

limite nullement k ceux de ses modes de mise en Evidence, de realisation et 
d' application qui vierment d'etre decrits de fagon plus explicite; elle en 
embrasse au contraire toutes les variantes qui peuvent venir h I'esprit du 
technicien en la mati^re, sans s'^carter du cadre, ru de la port6e, de la pr6sente 

20 invention. 
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LISTS DE SEQUENCES 

(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM: CNRS 

(B) RUE: 3 rue Michel Ange 

(C) VILLE: Paris 

(E) PAYS : FRANCE 

(F) CODE POSTAL: 75016 

(ii) TITRE DE L' INVENTION: SEQUENCES NUCLEIQUES CODANT POUR TOUT OU 
PARTIE D'UNE PROTEINE INTERAGISSANT AVEC LE RECEPTEUR AT2 ET LEURS 
APPLICATIONS . 

(iii) NOMBRE DE SEQUENCES: 12 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D» EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patent In Release #1.0, Version #1.30 (OEB) 

(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1803 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 178 . .1500 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 1: 

GCTACCCCCC CCCCACGCAC CCCCCAATCT GGGTGGCCTG GCATTAGCAT GTAAGCTTGT 60 

TTTTCTCTGG CTGTATCTCT TGGCCTGGAA GAACCCCGAG TTGCCAAGAG ACACAGTATG 120 

TGATGGTCCC TGGAAAAGCT GCTTCCCCTG CGAAGTTCTC CCACTGGCTT CGAAGAC 177 

ATG CTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATC CAC GTC CGC CTA 225 
Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr He His Val Arg Leu 
1 5 10 15 

ACC GCC AAA GGA CTG CTT CGA AAC CTC CGG CTT CCT TCG GGG CTC AGG 273 
Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 
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AAA AAC ACT GTC ATT TTC CAC ACA GTT GAA AAG GGC AGG GAG AAG AAT 321 
Lys Asn Thr Val He Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

CCC AGG AGC CTG TGC ATC . GAG ACC GAG ACA GCT CCA GAT GTG CTG TCC 369 
Pro Arg Ser Leu Cys He Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 55 60 

TCC GAG AGA ACG CTT GAG TTG GCC CAA TAG AAG ACA AAA TGT GAA AGC 417 
Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

CAA AGT GGA TTC ATC CTG CAC CTC AGG CAG CTT CTT TCC CGT GGT AAC 46 5 

Gin Ser Gly Phe He Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 

85 90 95 

AAC AAG TTT GAA GCG CTG ACA GTT GTG ATC CAG CAC CTC CTG TCT GAG 513 
Asn Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 110 

CGG GAG GAA GCA CTG AAG CAA CAC AAA ACC CTC TCT CAA GAA CTT GTC 561 
Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

AGC CTC CGG GGA GAG CTA GTT GCT GCT TCA AGC GCC TGT GAG AAG CTA 609 
Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

GAA AAG GCT AGG GCT GAC TTA CAG ACA GCG TAT CAA GAA TTT GTC CAG 657 
Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

AAA CTA AAC CAG CAG CAT CAG ACA GAC CGG ACG GAA CTG GAG AAC CGG 705 
LYS Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
165 170 175 

CTG AAG GAC TTA TAC ACC GCA GAG TGT GAG AAG CTT CAG AGC ATT TAC 753 
Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 
180 185 190 

ATT GAG GAG GCA GAA AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT GAC 801 
He Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 

AAC TTA AAC GCC GCC CAT GAG ACC ACT AAG CTT GAG ATT GAA GCT AGC 84 9 

Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 
210 215 220 

CAC TCG GAG AAG GTG GAA TTG CTG AAG AAG ACC TAT GAA ACC TCC CTT 897 
His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 
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TCA GAA ATC AAG AAG AGC CAT GAG ATG GAG AAG AAG TCA CTG GAG GAT 945 
Ser Glu lie Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

CTG CTT AAT GAG AAG CAG GAA TCG CTG GAG AAA CAA ATC AAT GAT CTG 993 
Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin lie Asn Asp Leu 
260 265 270 

AAG AGT GAA AAC GAT GCT TTA AAC GAA AGG TTG AAA TCA GAG GAG CAA 1041 
Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
275 280 285 

AAG CAA CTG TCA AGA GAG AAG GCG AAT TCC AAA AAC CCT CAG GTC ATG 1089 
Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 
290 295 300 

TAT CTG GAG CAA GAA CTA GAA AGC CTG AAG GCT GTG TTA GAG ATC AAG 1137 
Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu lie Lys 
305 310 315 320 

AAT GAG AAG CTG CAC CAG CAG GAC ATG AAG CTA ATG AAG ATG GAA AAG 1185 
Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

CTG GTG GAC AAT AAC AC A GCA TTG GTT GAC AAG CTG AAG CGA TTC CAG 123 3 

Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

CAG GAA AAC GAG GAG TTA AAA GCT CGC ATG GAC AAA CAC ATG GCA ATT 1281 
Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala lie 
355 360 365 

TCA AGG CAA CTT TCC ACC GAG CAG GCC GCG CTG CAA GAG TCC CTT GAG 132 9 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

AAG GAG TCA AAG GTC AAC AAG AGA CTG TCC ATG GAG AAC GAG GAA CTT 1377 
Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 

CTG TGG AAA CTG CAC AAC GGA GAC CTG TGC AGC CCC AAG AGA TCC CCC 1425 
Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 
405 410 415 

ACC TCC TCG GCC ATC CCT TTC CAG TCC CCC AGG AAT TCT GGT TCC TTC 1473 
Thr Ser Ser Ala He Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 
420 425 430 

TCC AGC CCC AGC ATC TCA CCC AGA TGA CGGCTTCTGA ACGCAGGAGA 1520 
Ser Ser Pro Ser He Ser Pro Arg * 
435 440 

CTCTCTGAAG GCACTGAGGT GCGCTTCTGC AGGACTGACC CTCTCATGGG AACTCGAGTT 1580 

GCTGCGTTAG CTCTCTGGAA TATCCCCAGG ATATCGGGAG AGCAGCCGCC AACCGTATCA 1640 
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GCTACGTACG AATAGAGAGC TCCAATAGAA GACTTTTAAC TTGGTCCAAA AGCCTCCTCC 1700 

AAAAACAGAT TTCGGAACTG AAGTGGACAT AGTTGCACAA AGCACTTACG GAACGAGGGA 1760 

ACCTTGTTCT TTGCCTTCCT TCACCTAAGC ATAGGCTTTC CAG 1803 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQXreiNCE: 

(A) LONGUEUR: 440 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 

Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His Val Arg Leu 
1 5 10 15 

Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 

Lys Asn Thr Val lie Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

Pro Arg Ser Leu Cys lie Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 S5 60 

Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

Gin Ser Gly Phe lie Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 
85 90 95 

Asn Lys Phe Glu Ala Leu Thr Val Val lie Gin His Leu Leu Ser Glu 
100 105 110 

Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

Lys Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
165 170 175 

Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 
180 185 190 
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lie Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 



Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu lie Glu Ala Ser 
210 215 220 

His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 

Ser Glu lie Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin lie Asn Asp Leu 
260 265 270 

Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
275 280 285 

Lys Gin Leu Ser Arg Glu Lys TVla Asn Ser Lys Asn Pro Gin Val Met 
290 295 300 

Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu lie Lys 
305 310 315 320 

Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala He 
355 360 365 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 



Leu Trp Lys Leu 



Thr Ser Ser Ala 
420 



His Asn Gly Asp 
405 

He Pro Phe Gin 



Leu Cys Ser Pro 
410 

Ser Pro Arg Asn 
425 



Lys Arg Ser Pro 
415 

Ser Gly Ser Phe 
430 



Ser Ser Pro Ser He Ser Pro Arg * 
435 440 

(2) INFORMATIONS POUR LA SEQ ID NO : 3; 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1323 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADNc 



{ ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT:!. .1322 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 3 : 

ATG CTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATC CAC GTC CGC CTA 48 
Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr He His Val Arg Leu 

ACC GCC AAA GGA CTG CTT CGA AAC CTC CGG CTT CCT TCG GGG CTC AGG 96 
Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 

AAA AAC ACT GTC ATT TTC CAC ACA GTT GAA AAG GGC AGG CAG AAG AAT 144 
Lys Asn Thr Val He Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 

CCC AGG AGC CTG TGC ATC CAG ACC CAG ACA GCT CCA GAT GTG CTG TCC 192 
Pro Arg Ser Leu Cys He Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 

TCC GAG AGA ACG CTT GAG TTG GCC CAA TAC AAG ACA AAA TGT GAA AGC 240 
ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 

CAA AGT GGA TTC ATC CTG CAC CTC AGG CAG CTT CTT TCC CGT GGT AAC 288 
Gin Ser Gly Phe He Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 

AAC AAG TTT GAA GCG CTG ACA GTT GTG ATC CAG CAC CTC CTG TCT GAG 336 
Asn Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 

CGG GAG GAA GCA CTG AAG CAA CAC AAA ACC CTC TCT CAA GAA CTT GTC 384 
Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 

AGC CTC CGG GGA GAG CTA GTT GCT GCT TCA AGC GCC TGT GAG AAG CTA 
Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 

GAA AAG GCT AGG GCT GAC TTA CAG ACA GCG TAT CAA GAA TTT GTC CAG 
Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 

AAA CTA AAC CAG CAG CAT CAG ACA GAC CGG ACG GAA CTG GAG AAC CGG 528 
Lys Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 

CTG AAG GAC TTA TAC ACC GCA GAG TGT GAG AAG CTT CAG AGC ATT TAC 576 
Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 

ATT GAG GAG GCA GAA AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT GAC 624 
He Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 

AAC TTA AAC GCC GCC CAT GAG ACC ACT AAG CTT GAG ATT GAA GCT AGC 
Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 

CAC TCG GAG AAG GTG GAA TTG CTG AAG AAG ACC TAT GAA ACC TCC CTT 
His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 



432 



480 



672 



720 



TCA GAA ATC AAG AAG AGC CAT GAG ATG 
Ser Glu lie Lys Lys Ser His Glu Met 

CTG CTT AAT GAG AAG CAG GAA TCG CTG 
Leu Leu Asn Glu Lys Gin Glu Ser Leu 

AAG AGT GAA AAC GAT GCT TTA AAC GAA 
Lys Ser Glu Asn Asp Ala Leu Asn Glu 

AAG CAA CTG TCA AGA GAG AAG GCG AAT 
Lys Gin Leu Ser Arg Glu Lys Ala Asn 

TAT CTG GAG CAA GAA CTA GAA AGC CTG 
Tyr Leu Glu Gin Glu Leu Glu Ser Leu 

AAT GAG AAG CTG CAC CAG CAG GAC ATG 
Asn Glu Lys Leu His Gin Gin Asp Met 

CTG GTG GAC AAT AAC ACA GCA TTG GTT 
Leu Val Asp Asn Asn Thr Ala Leu Val 

CAG GAA AAC GAG GAG TTA AAA GCT CGC 
Gin Glu Asn Glu Glu Leu Lys Ala Arg 

TCA AGG CAA CTT TCC ACC GAG CAG GCC 
Ser Arg Gin Leu Ser Ttir Glu Gin Ala 

AAG GAG TCA AAG GTC AAC AAG AGA CTG 
Lys Glu Ser Lys Val Asn Lys Arg Leu 

CTG TGG AAA CTG CAC AAC GGA GAC CTG 
Leu Trp Lys Leu His Asn Gly Asp Leu 

ACC TCC TCG GCC ATC CCT TTC CAG TCC 
Thr Ser Ser Ala He Pro Phe Gin Ser 

TCC AGC CCC AGC ATC TCA CCC AGA TG 
Ser Ser Pro Ser He Ser Pro Arg 
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GAG AAG AAG TCA CTG GAG GAT 768 
Glu Lys Lys Ser Leu Glu Asp 

GAG AAA CAA ATC AAT GAT CTG 816 
Glu Lys Gin lie Asn Asp Leu 

AGG TTG AAA TCA GAG GAG CAA 864 
Arg Leu Lys Ser Glu Glu Gin 

TCC AAA AAC CCT CAG GTC ATG 912 
Ser Lys Asn Pro Gin Val Met 

AAG GCT GTG TTA GAG ATC AAG 960 
Lys Ala Val Leu Glu He Lys 

AAG CTA ATG AAG ATG GAA AAG 1008 
Lys Leu Met Lys Met Glu Lys 

GAC AAG CTG AAG CGA TTC CAG 1056 
Asp Lys Leu Lys Arg Phe Gin 

ATG GAC AAA CAC ATG GCA ATT 1104 
Met Asp Lys His Met Ala lie 

GCG CTG CAA GAG TCC CTT GAG 1152 
Ala Leu Gin Glu Ser Leu Glu 

TCC ATG GAG AAC GAG GAA CTT 1200 
Ser Met Glu Asn Glu Glu Leu 

TGC AGC CCC AAG AGA TCC CCC 1248 
Cys Ser Pro Lys Arg Ser Pro 

CCC AGG AAT TCT GGT TCC TTC 1296 
Pro Arg Asn Ser Gly Ser Phe 

A 1323 



(2) INFORMATIONS POUR LA SEQ ID NO : 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 440 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lin§aire 

<ii) TYPE DE MOLECULE: prot€ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 



Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr He His Val Arg Leu 
15 10 15 
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Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 

Lys Asn Thr Val He Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

Pro Arg Ser Leu Cys He Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 55 60 

Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

Gin Ser Gly Phe He Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 
85 90 95 

Asn Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 110 

Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

Lvs Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
^ 165 170 175 

Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 
180 185 190 

He Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 

Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 
210 215 220 

His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 

Ser Glu He Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu 
260 265 270 

Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
275 280 285 

Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 
29Q . 295 300 
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Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu lie Lys 
305 310 315 320 

Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala lie 
355 360 365 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 

Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 
405 410 415 

Thr Ser Ser Ala lie Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 
420 425 430 

Ser Ser Pro Ser He Ser Pro Arg 
435 440 

(2) INFORMATIONS POUR LA SEQ ID NO : 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 354 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lin^aire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT :1. .354 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

CAT CAG ACA GAC CGG ACG GAA CTG GAG AAC CGG CTG AAG GAC TTA TAC 48 
His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg Leu Lys Asp Leu Tyr 

ACC GCA GAG TGT GAG AAG CTT CAG AGC ATT TAC ATT GAG GAG GCA GAA 96 
Thr Ala Glu Cys Glu Lys Leu Gin Ser lie.. Tyr lie Glu Glu Ala Glu 

AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT GAC AAC TTA AAC GCC GCC 144 
Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp Asn Leu Aisn Ala Ala 




CAT GAG ACC ACT AAG CTT GAG ATT GAA 
His Glu Thr Thr Lys Leu Glu lie Glu 

GAA TTG CTG AAG AAG ACC TAT GAA ACC 
Glu Leu Leu Lys Lys Thr Tyr Glu Thr 

AGC CAT GAG ATG GAG AAG AAG TCA CTG 
Ser His Glu Met Glu Lys Lys Ser Leu 

CAG GAA TCG CTG GAG AAA CAA ATC AAT 
Gin Glu Ser Leu Glu Lys Gin lie Asn 

GCT TTA AAC GAA AGG TTG 
Ala Leu Asn Glu Arg Leu 
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GCT AGC CAC TCG GAG AAG GTG 192 
Ala Ser His Ser Glu Lys Val 

TCC CTT TCA GAA ATC AAG AAG 240 
Ser Leu Ser Glu lie Lys Lys 

GAG GAT CTG CTT AAT GAG AAG 288 
Glu Asp Leu Leu Asn Glu Lys 

GAT CTG AAG AGT GAA AAC GAT 336 
Asp Leu Lys Ser Glu Asn Asp 

354 



(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQtJES DE LA SEQUENCE: 

(A) LONGUEUR: 118 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg Leu Lys Asp Leu Tyr 



1 



5 10 15 



Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr He Glu Glu Ala Glu 
20 25 30 

Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala Ala 
35 40 45 

His Glu Thr Thr Lys Leu Glu He Glu Ala Ser His Ser Glu Lys Val 
50 . 55 60 

Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu Ser Glu He Lys Lys 
65 70 75 80 

Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp Leu Leu Asn Glu Lys 
85 90 

Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu Lys Ser Glu Asn Asp 
100 105 110 

Ala Leu Asn Glu Arg Leu 
115 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3742 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



( ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 2 93 . .1600 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 7 : 

CAGTGTGATG TGGTTCAGAG GCAGCTTCTA GACCTGCAGG AGGGAGATTG TATTCAGAGG 60 

AAGAGCATCA TTTTGGCAAC ATCTGAAAGT GAAAACGGAA GCCAGAAACA CTTGGCCAGC 120 

CCTGGGGGAT TTTTTTCTTC TATGCCTCTG TGGTGGAATG ACATTTGCTG TGTAGGCATC 180 

TTTCCTCTGA CTGTATTTCT TGGCCTTGAA GAGTACTGAG TTTAAAAAGA CAGTATGTGA 24 0 

CAGTCCATGG AAATTGCCTC TTCTGTGAAA TCTCGCCACC TGCTCCGAAG AC ATG 295 

Met 

TTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATT CAC ATA CGA CTG ACG 343 
Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His lie Arg Leu Thr 

GCC AAA GGA TTG CTT CGA AAC CTT CGA CTT CCT TCA GGG TTT AGG AGA 3 91 

Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Phe Arg Arg 

AGC ACT GTT GTT TTC CAC ACA GTT GAA AAG AGC AGG CAA AAG AAT CCT 43 9 

Ser Thr Val Val Phe His Thr Val Glu Lys Ser Arg Gin Lys Asn Pro 

CGA AGC TTA TGT ATC CAG CCA CAG ACA GCT CCC GAT GCG CTG CCC CCT 48 7 

Arg Ser Leu Cys lie Gin Pro Gin Thr Ala Pro Asp Ala Leu Pro Pro 

GAG AAA ACA CTT GAA TTG ACG CAA TAT AAA ACA AAA TGT GAA AAC CAA 535 
Glu Lys Thr Leu Glu Leu Thr Gin Tyr Lys Thr Lys Cys Glu Asn Gin 

AGT GGA TTT ATC CTG CAG CTC AAG CAG CTT CTT GCC TGT GGT AAT ACC 583 
Ser Gly Phe lie Leu Gin Leu Lys Gin Leu Leu Ala Cys Gly Asn Thr 

AAG TTT GAG GCA TTG ACA GTT GTG ATT CAG CAC CTG CTG TCT GAG CGG 631 
Lys Phe Glu Ala Leu Thr Val Val lie Gin His Leu Leu Ser Glu Arg 

GAG GAA GCA CTG AAA CAA CAC AAA ACC CTA TCT CAA GAA CTT GTT AAC 679 
Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val Asn 

CTC CGG GGA GAG CTA GTC ACT GCT TCA ACC ACC TGT GAG AAA TTA GAA 727 
Leu Arg Gly Glu Leu Val Thr Ala Ser Thr Thr Cys Glu Lys Leu Glu 

AAA GCC AGG AAT GAG TTA CAA ACA GTG TAT GAA GCA TTC GTC CAG CAG 775 
Lys Ala Arg Asn Glu Leu Gin Thr Val Tyr Glu Ala Phe Val Gin Gin 
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CAC CAG GCT GAA AAA ACA GAA CGA GAG AAT CGG CTT AAA GAG TTT TAG 
His Gin Ala Glu Lys Thr Glu Arg Glu Asn Arg Leu Lys Glu Phe Tyr 

ACC AGG GAG TAT GAA AAG CTT CGG GAC ACT TAG ATT GAA GAA GCA GAG 
Thr Arg Glu Tyr Glu Lys Leu Arg Asp Thr Tyr He Glu Glu Ala Glu 

AAG TAG AAA ATG CAA TTG CAA GAG CAG TTT GAC AAC TTA AAT GCG CAT 
Lys Tyr Lys Met Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala His 

GAA ACC TCT AAG TTG GAA ATT GAA GCT AGC CAC TCA GAG AAA CTT GAA 
^ Thr Ser Lys Leu Glu He Glu Ala Ser His Ser Glu Lys Leu Glu 

TTG CTA AAG AAG GCC TAT GAA GCC TCC CTT TCA GAA ATT AAG AAA GGC 
Leu Leu Lys Lys Ala Tyr Glu Ala Ser Leu Ser Glu He Lys Lys Gly 

CAT GAA ATA GAA AAG AAA TCG CTT GAA GAT TTA CTT TCT GAG AAG CAG 
His Glu He Glu Lys Lys Ser Leu Glu Asp Leu Leu Ser Glu Lys Gin 

GAA TCG CTA GAG AAG CAA ATC AAT GAT CTG AAG AGT GAA AAT GAT GCT 
Glu ser Leu Glu Lys Gin He Asn Asp Leu Lys Ser Glu Asn Asp Ala 

TTA AAT GAA AAA TTG AAA TCA GAA GAA CAA AAA AGA AGA GCA AGA GAA 
llu Asn Glu Lys Leu Lys Ser Glu Glu Gin Lys Arg Arg Ala Arg Glu 

AAA GCA AAT TTG AAA AAT CCT CAG ATC ATG TAT CTA GAA CAG GAG TTA 
Lys Ala Asn Leu Lys Asn Pro Gin He Met Tyr Leu Glu Gin Glu Leu 

GAA AGC CTG AAA GCT GTG TTA GAG ATC AAG AAT GAG AAA CTG CAT CAA 
ser Leu Lys Ala Val Leu Glu He Lys Asn Glu Lys Leu Hxs Gin 

CAG GAC ATC AAG TTA ATG AAA ATG GAG AAA CTG GTG GAC AAC AAC ACA 
111 He Lys Leu Met Lys Met Glu Lys Leu Val Asp Asn Asn Thr 

GCA TTG GTT GAC AAA TTG AAG CGT TTC CAG CAG GAG AAT GAA GAA TTG 
Leu val ASP Lys Leu Lys Arg Phe Gin Gin Glu Asn Glu Glu Leu 

AAA GCT CGG ATG GAC AAG CAC ATG GCA ATC TCA AGG CAG CTT TCC ACG 
^ Ala Arg Met Asp Lys His Met Ala He Ser Arg Gin Leu Ser Thr 

GAG CAG GCT GTT CTG CAA GAG TCG CTG GAG AAG GAG TCG AAA GTC AAC 
111 Gin Ala val Leu Gin Glu Ser Leu Glu Lys Glu Ser Lys Val Asn 

AAG CGA CTC TCT ATG GAA AAC GAG GAG CTT CTG TGG AAA CTG CAC AAT 
Lys Arg Leu Ser Met Glu Asn Glu Glu Leu Leu Trp Lys Leu His Asn 

GGG GAC CTG TGT AGC CCC AAG AGA TCC CCC ACA TCC TCC GCC ATC CCT 
Sp Su Cys ser Pro Lys Arg Ser Pro Thr Ser Ser Ala He Pro 

TTG CAG TCA CCA AGG AAT TCG GGC TCC TTC CCT AGC CCC AGC ATT TCA 
ser Pro Arg Asn Ser Gly Ser Phe Pro Ser Pro Ser He Ser 

CCC AGA TGA CACGTCCCCA AAGTCCACAG ACTCTCTGAA AGCATTTTGA 
Pro Arg * 

TGCAGGTCTG CAGGACTGAC CCCAAGGAGG AACGTGGGCA CAAGAGGTAT ATCAGCACAC 



823 



871 



919 



967 



1015 



1063 



1111 



1159 



1207 



1255 



1303 



1351 



1399 



1447 



1495 



1543 



1591 



1640 



1700 
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GTGTGATCAC CGTAGGTAAC TGGAGCGTCA CCACCGGCGG AATCGAGCTT CTGAGACTGG 1760 

AAGTCTGGAG GAAGACTTTT GCCTCCGTCC AAAAGATTCC TCCAAAAAAA GATTTAAAAA 1820 

AAGATTTCGG CATCGACACG GACGTTGTTG CACAAAGCAC TTAAAGAACG AGAGCATCTT 1880 

GTTCATTGCC TTTTTCACCT AAGCATAAGG GGAAAAACTC TCAGGGCCCT ATTAAGATTT 1940 

ATAACCTTTG TAATGTTCTT CACCACAGAC ACCTTCTTGT GAGTTTTCAG TCTGACTGTG 2000 

GGGGTGGGGG GTGTGAATGA AATGGATGTC ACAGAGTGTC ATGTGTCTGA TGCAGCCTCC 2 060 

TCTGCTGTGT ATTAAATGTC AAAATCTGAA TATATCTGGA TATGTACTAA TCAAATAATA 2120 

ATCAATCAAT CAGCATATAC ATTTCAGCCA AAGCCATAGA AGAAAAAGCA ATAGTTGCTT 218 0 

GAATTATGAT CATCTACCAC CAACTCTGCT CAGCCCTGTA ACAGGGTAGG GAGAGGGTAT 22 40 

AACAGGAAGA GCTTTGACTT GTCCCTGTCT ATACATTCTC TGTATCTTTT GGGGGTAACT 23 00 

TCTTGGCAGT TTTTCAGTGT TCAGCCATGT CAGTTGAAAC TAGATTTTTC TGTAGATTTT 23 60 

TTACTTACCC ATGTGAGCCT AACACTATCC TGTAATTCAT TTTCTCAGGC TATGTGTAAA 2420 

TGTAGAACCC TAATTTTTCT ATAAAAAAAC AAACTAACTA ACTGTGTAAA GAAAGAAAAA 24 80 

GGGAAGTACC AATGGGTTTT TCCACCTTAT TTTTACCTTT GATCTACCCT TGCAGATTTA 254 0 

ACCTGTCTTC TTCCCTCCCA TTATTCTCAT TTTCCTTTTA CCTTTCTCCA CCATCCAGAG 2600 

CCACAAAAGC AAACCTTCTA CCTCCTACCT ACTTTTCTCT GGGACAAGGA TAAAGGAATA 266 0 

TGATTTTCCA GAGCCCCAGA GCCAGCTCAT CTTCCAGGTG CTGAAACCAC TTTCCAAATA 272 0 

AACTAAAGCC TGGATTTGAT ATTACAAATT TTGGGAAATC TTAGAATAAA GAACGAGAAC 278 0 

AAGGAAGTCA TTGGCTAGTA TAATTAAGAA AGGTAGGATT CAGTGCTTAC CGATGATGCA 284 0 

GTACTTGATA GAAGAAAACA GTCTGGGAGG ATAGCGCTCA TTTTTCAGTT ACCCTTTAAG 2900 

GAGTCCCTTT GTCTTTGGGA AAGTAGCAGA ATGGTCCGCT TCTTTCCCAT GAGTGGAAAA 2960 

TGTGGCTTGT CCAACTCTCC TCCAGGTTGC ATTTCAGTTT CTTTCCAAAA CTTATTACCT 3 020 

CCCCTAATCC TGAGACTTTG GAAAAGGTGG AAGGAAGAAC TGTTGCTTTA TCTCCCCCTC 3080 

CCTGCATGTG TCAACATTGT GATGTCAGTA TTTACTAATC TACATTCAGT GGCTGTACAA 3140 

ATAACAGCTG TAGTAAGAAG AGATTCAGGA TGCTAGAGGT GAATATTTGG GTCATTTACA 3200 

TGTACACTAC ATAGCAAGTT GATACTCATG TTGCATGTTC TTTTAAATTA GTGATTTTGT 3260 

GTCTTAAGTC TTTAACTTCC AATACTTCAT CATGTATGTA ACCTTCCATG TTTGCTTCTG 3 320 
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ATAAATGGAA ATGTAGGTTC ACTGCCACTT CATGAGATAT CTCTGCTCAC GCTTCCAAGT 3380 

TGTTCTCAAT GACATTAGCC AAAGTTGGGT TTGCCATTCA TCCCCTAGGC ATGGTAAATC 3440 

TTGTGTTGTT CCCTGCTGTC CTCCGTATTA CGTGACCGGC AAATAAATCT CATAGCAGTT 3500 

AATATAAAAC ATCTTTGGAG GATGGGAGAG AACAGGAGGG AAGATGGGAA ACAAAATAGA 3560 

GAATTCTTAA GATTTTGTTT AAACCAAATG TTTCATGTAG AATGCAAAAT GTTGGCACGT 3620 

CAAAAATATG AATGTGTAGA CAACTGTAGT TGTGCTCAGT TTGTAGTGAT GGGAAGTGTA 3680 
TTTTACTCTG ATCAAATAAA TAATGCTGGA ATACTCAAAA AAAAAAAAAA AAAAAAAAAA 



AA 



(2) INFORMATIONS POXJR LA SEQ ID NO : 8 : 

(i) CARACTERISTIQtJES DE LA SEQUENCE: 

(A) LONGUEUR: 43 5 acides amines 

(B) TYPE: acide aminS 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 
Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr He His He Arg Leu 



1 



5 10 15 



Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Phe Arg 
20 25 30 

Arg ser Thr Val Val Phe His Thr Val Glu Lys Ser Arg Gin Lys Asn 
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Pro Arg Ser Leu Cys He Gin Pro Gin Thr Ala Pro Asp Ala Leu Pro 
50 55 60 

Pro Glu Lys Thr Leu Glu Leu Thr Gin Tyr Lys Thr Lys Cys Glu Asn 
65 70 75 80 

Gin Ser Gly Phe He Leu Gin Leu Lys Gin Leu Leu Ala Cys Gly Asn 



Thr Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 110 

Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
lis 120 125 

Asn Leu Arg Gly Glu Leu Val Thr Ala Ser Thr Thr Cys Glu Lys Leu 
130 135 140 



3740 
3742 
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Glu Lys Ala Arg Asn Glu Leu Gin Thr Val Tyr Glu Ala Phe Val Gin 
145 150 155 160 

Gin His Gin Ala Glu Lys Thr Glu Arg Glu Asn Arg Leu Lys Glu Phe 
165 170 175 

Tyr Thr Arg Glu Tyr Glu Lys Leu Arg Asp Thr Tyr lie Glu Glu Ala 
180 185 190 

Glu Lys Tyr Lys Met Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala 
195 200 205 

His Glu Thr Ser Lys Leu Glu lie Glu Ala Ser His Ser Glu Lys Leu 
210 215 220 

Glu Leu Leu Lys Lys Ala Tyr Glu Ala Ser Leu Ser Glu He Lys Lys 
225 230 235 240 

Gly His Glu He Glu Lys Lys Ser Leu Glu Asp Leu Leu Ser Glu Lys 
245 250 255 

Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu Lys Ser Glu Asn Asp 
260 265 270 

Ala Leu Asn Glu Lys Leu Lys Ser Glu Glu Gin Lys Arg Arg Ala Arg 
275 280 285 

Glu Lys Ala Asn Leu Lys Asn Pro Gin He Met Tyr Leu Glu Gin Glu 
290 295 300 

Leu Glu Ser Leu Lys Ala Val Leu Glu He Lys Asn Glu Lys Leu His 
305 310 315 320 

Gin Gin Asp He Lys Leu Met Lys Met Glu Lys Leu Val Asp Asn Asn 
325 330 335 

Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin Gin Glu Asn Glu Glu 
340 345 350 

Leu Lys Ala Arg Met Asp Lys His Met Ala He Ser Arg Gin Leu Ser 
355 360 365 

Thr Glu Gin Ala Val Leu Gin Glu Ser Leu Glu Lys Glu Ser Lys Val 
370 375 380 

Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu Leu Trp Lys Leu His 
385 390 395 400 

Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro Thr Ser Ser Ala He 
405 410 415 



Pro Leu Gin Ser Pro Arg Asn Ser Gly Ser Phe Pro Ser Pro Ser He 
420 425 430 



40 



Ser Pro Arg * 
435 



60 



300 
360 



(2) INFORMATIONS POUR LA SEQ ID NO : 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 13 08 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: linSaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQtJENCE : SEQ ID NO: 9: 
ATGTTGTTGT CTCCCAAATT CTCCTTATCC ACCATTCACA TACGACTGAC GGCCAAAGGA 

TTGCTTCGAA ACCTTCGACT TCCTTCAGGG TTTAGGAGAA GCACTGTTGT TTTCCACACA 120 

GTTGAAAAGA GCAGGCAAAA GAATCCTCGA AGCTTATGTA TCCAGCCACA GACAGCTCCC 180 

GATGCGCTGC CCCCTGAGAA AACACTTGAA TTGACGCAAT ATAAAACAAA ATGTGAAAAC 240 
CAAAGTGGAT TTATCCTGCA GCTCAAGCAG CTTCTTGCCT GTGGTAATAC CAAGTTTGAG 
GCATTGACAG TTGTGATTCA GCACCTGCTG TCTGAGCGGG AGGAAGCACT GAAACAACAC 

AAAACCCTAT CTCAAGAACT TGTTAACCTC CGGGGAGAGC TAGTCACTGC TTCAACCACC 420 

TGTGAGAAAT TAGAAAAAGC CAGGAATGAG TTACAAACAG TGTATGAAGC ATTCGTCCAG 480 

CAGCACCAGG CTGAAAAAAC AGAACGAGAG AATCGGCTTA AA6AGTTTTA CACCAGGGAG 540 
TATGAAAAGC TTCGGGACAC TTACATTGAA GAAGCAGAGA AGTACAAAAT GCAATTGCAA 
GAGCAGTTTG ACAACTTAAA TGCGCATGAA ACCTCTAAGT TGGAAATTGA AGCTAGCCAC 

TCAGAGAAAC TTGAATTGCT AAAGAAGGCC TATGAAGCCT CCCTTTCAGA AATTAAGAAA 720 

GGCCATGAAA TAGAAAAGAA ATCGCTTGAA GATTTACTTT CTGAGAAGCA GGAATCGCTA 7 80 

GAGAAGCAAA TCAATGATCT GAAGAGTGAA AATGATGCTT TAAATGAAAA ATTGAAATCA 840 

GAAGAACAAA AAAGAAGAGC AAGAGAAAAA GCAAATTTGA AAAATCCTCA GATCATGTAT 900 

CTAGAACAGG AGTTAGAAAG CCTGAAAGCT GTGTTAGAGA TCAAGAATGA GAAACTGCAT 960 

CAACAGGACA TCAAGTTAAT GAAAATGGAG AAACTGGTGG ACAACAACAC AGCATTGGTT 1020 

GACAAATTGA AGCGTTTCCA GCAGGAGAAT GAAGAATTGA AAGCTCGGAT GGACAAGCAC 1080 

ATGGCAATCT CAAGGCAGCT TTCCACGGAG CAGGCTGTTC TGCAAGAGTC GCTGGAGAAG 1140 



600 
660 
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GAGTCGAAAG TCAACAAGCG ACTCTCTATG GAAAACGAGG AGCTTCTGTG GAAACTGCAC 1200 

AATGGGGACC TGTGTAGCCC CAAGAGATCC CCCACATCCT CCGCCATCCC TTTGCAGTCA 1260 

CCAAGGAATT CGGGCTCCTT CCCTAGCCCC AGCATTTCAC CCAGATGA 1308 



(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
CAAGCGTTCT CTCGGAGGAC A 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 33 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CGCGGATCCC AGACAGACCG GACGGAACTG GAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 34 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 



CCGGAATTCA CTACAACCTT TCGTTTAAAG CATC 



34 
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REVENDICATIONS 

1°) Fragment d'acides nucl^iques isole, codant pour une 
prot^ine apte k se lier au r^cepteur AT2, lequel fragment est selectionn^ dans 
le groupe constitu6 par les sequences SEQ ID NO:l, 3, 5, 7 et 9. 
5 2") Fragment d'une des sequences selon la revendication 1, 

utile comme sondes ou comme amorces, pour la detection des sequences SEQ 

ID NO:l, 3, 5, 7 ou 9. 

3") Fragment selon la revendication 2, caract6ris6 en ce qu'il 
comprend au moins 20 pb incluses dans les sequences SEQ ID NO:l, 3, 5, 7 ou 
10 9. 

4") Fragment selon la revendication 2 ou la revendication 3, 
caract6ris6 en ce qu'il est s6lectiorm6 dans le groupe constitu6 par les 
sequences SEQ ID NO:5, SEQ ID NO:10, SEQ ID NOllet SEQ ID NO:12. 

5") Transcrits, caract6ris6s en ce qu'ils sont compl6mentaires 

1 5 des sequences selon la revendication 1 . 

6") Prot6ine purifiee et Isolde, apte k interagir avec le recep- 
teur AT2, s6lectionn6e dans le groupe constitu6 par les sequences SEQ ID 
NO:2, 4, 6 ou 8, laquelle prot6ine est d§nomm6e ATIP. 

7°) Produit de traduction, caract6ris6 en ce qu'il est code par 
20 une sequence nucl6otidique selon la revendication 1. 

8°) Anticorps, caract6ris6s en ce qu'Us sont dirig^s centre ime 
prot6ine ou un fragment de prot6ine selon la revendication 6 ou la revendica- 
tion 7. 

9") Vecteur recombinant de cloriage et/ou d'expression, carac- 
25 t6ris6 en ce qu'il comprend une sequence nucl6otidique selon la revendication 
1. 

10°) Cellule hdte transform6e, caracterisee en ce qu'elle 
comprend un vecteur selon la revendication 9. 

11°) Cellules hdtes transformees, caract6ris§es en ce qu'elles 
30 sont constitutes par une souche de levure convenable co-transformee avec au 
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moins deux vecteurs qui codent respectivement (i) pour une prot6ine dite 
appat s6lectionnee dans le groupe constitue par un fragment contenant au 
moins la SEQ ID NO:5 de la proteine ATIP selon la revendication 6 ou la 
revendication 7 et un fragment contenant au moins rextr6mit6 C-temiinale du 
recepteur AT2, laquelle proteine appat est fusionnee k une proteine s6lection- 
nee dans le groupe constitu6 par le domaine de liaison ^ TADN d'un facteur 
de transcription et le domaine deactivation du mSme facteur de transcription 
et (ii) pour une proteine dite proie, s^lectionnee dans le groupe constitu6 par 
un fragment contenant au moins la SEQ ID NO:5 de la proteine ATIP selon la 
revendication 6 ou la revendication 7, un fragment contenant au moins 
I'extr^mit^ C-terminale du recepteur AT2 et tout autre polypeptide corres- 
pondant h une sequence contenue dans une banque d' ADNc, laquelle prot6ine 
proie est fusionnee a une proteine selectionn^e dans le groupe constitue par le 
domaine de liaison k TADN d'un facteur de transcription et le domaine 
deactivation du meme facteur de transcription, lesquels vecteurs comportent 
en outre des marquetirs de selection, 

12°) CellTile hote transformee selon la revendication 11, carac- 
t6ris6e en ce qu'elle est constitute par une souche de levure convenable co- 
transform6e avec trois vecteurs qui codent respectivement pour (i) un appat 
correspondant k un fragment contenant Textremitt C-terminale du receptexir 
AT2 fusionn6 k une proteine selectionnee dans le groupe constitue par le 
domaine de liaison k I'ADN d'lm facteur de transcription et le domaine 
d' activation dudit facteur de transcription, (ii) un fragment contenant au 
moins la SEQ ID NO:5 de la proteine ATIP selon la revendication 6 ou la 
revendication 7, fusionn6 k une proteine s6lectionn6e dans le groupe constitu6 
par le domaine de liaison k VADN d'lm facteur de transcription et le domaine 
deactivation dudit facteur de transcription et (iii) un polypeptide correspon- 
dant k une sequence contenue dans une banque d'ADNfc, lesquels vecteurs 
comportent en outre des marqueurs de selection. 

13**) Cellule h6te transform6e selon la revendication 11, carac- 
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t6ris6e en ce qu'elle est constitute par une souche de levure convenable co- 
transfonn6e avec deux vecteurs qui cedent respectivement pour (i) un frag- 
ment contenant au moins la sequence SEQ ID NO:5 de la prot6ine ATIP selon 
la revendication 6 ou la revendication 7, fusionn6 k une prot6ine s6lectionn6e 
5 dans le groupe constitu6 par le domaine de liaison k I'ADN d'un facteur de 
transcription et le domaine d'activation dudit facteur de transcription et (ii) un 
polypeptide correspondant k une sequence contenue dans une banque 
d'ADNc, fusionn6 k une prot^ine s6lectionn6e dans le groupe constitu6 par le 
domaine de liaison k I'ADN d'un facteur de transcription et le domaine d'acti- 
10 vation dudit facteur de transcription, lesquels vecteurs comportent en outre 
des mzirqueiirs de selection. 

14°) Cellule hdte transform6e selon la revendication 11, carac- 
t6ris6e en ce qu'elle est constitute par une souche de levure convenable co- 
transform6e avec deux vecteurs, k savoir (i) im vecteur codant pour un frag- 
15 ment contenant au moins la sequence SEQ ID NO:5 de la proteine ATIP selon 
la revendication 6 mut6e ou non, fusionn6 une proteine s6lectionn6e dans le 
groupe constitu6 par le domaine de liaison k I'ADN d'un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription et (ii) un vecteur 
codant pour un fragment contenant I'extr6mit6 C-terminale du rtcepteur AT2 
20 mut6 ou non, fusionnt k une proteine s6lectionn6e dans le groupe constitu6 
par le domaine de liaison k I'ADN d'un facteur de transcription et le domaine 
d'activation dudit facteur de transcription, lesquels vecteurs comportent en 
outre des marqueurs de selection,, I'un des deux vecteurs codant obligatoire- 
ment pour tme prot6ine mut6e. 
25 15°) M6thode de selection de prottines inhibitrices de 

I'interaction prot6ine ATIP selon la revendication 6 ou la revendication 7- 
rtcepteur AT2, laquelle mttirode comprend : 

(a) la co-transformation d'une souche de levure convenable 
avec trois vecteurs qui cedent respectivement pour (i) un appat correspondant 
30 ^ un fragment contenant I'extr6mit6 C-terminale du recepteur AT2 fusionn6 k 
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une prot6ine s61ectionnee dans le groupe constitu6 par le domaine de liaison h 
I*ADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 
proteine ATIP selon la revendication 6 ou la revendication 7, fusionn^ ^ ime 
5 prot§ine selectionn6e dans le groupe constitue par le domaine de liaison h 
TADN d'lm facteur de transcription et le domaine d'activation dudit facteur 
de transcription et (iii) un polypeptide correspondant h une sequence conte- 
nue dans une banque d'ADNc, lesquels vecteurs comportent en outre des 
marqueiurs de selection, 
10 (b) la selection des clones de la banque d'ADNc exprimant un 

polypeptide inhibant Tinteraction recepteur AT2-proteine ATIP selon la 
revendication 6 ou la revendication 7, sur un milieu selectif appropri6 et 
(c) Tidentification dudit polypeptide. 

16°) M6thode de criblage de polypeptides interagissant avec 
15 la prot6ine ATIP selon la revendication 6 ou la revendication 7, laquelle 
m^thode comprend : 

(a) la co-transformation d'une souche de levure convenable 
avec deux vecteurs tels que d^finis ci-dessus, k savoir qui codent respective- 
ment potir (i) un fragment contenant au moins la SEQ ID NO:5 de la prot6ine 

20 ATIP selon la revendication 6 ou la revendication 7, fusionne k une proteine 
s6lectionnee dans le groupe constitue par le domaine de liaison k I'ADN d'xm 
facteur de transcription et le domaine d'activation dudit facteur de transcrip- 
tion, et (ii) un polypeptide correspondant a une sequence contenue dans une 
banque d'ADNc, fusionn^ k une proteine selectionnee dans le groupe consti- 

25 tu6 par le domaine de liaison k I'ADN d'un facteur de transcription et le 
domaine d'activation dudit facteur de transcription, lesquels vecteurs 
comportent en outre des marqueurs de selection, et 

(b) la selection des clones exprimant un polypeptide interagis- 
sant avec la proteine ATIP selon la revendication 6 ou la revendication 7, sur 

30 un niilieu s6lectif convenable. 
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17°) M6thode de caract6risation des domaines impliqu^s dans 
I'interaction proteine ATIP-recepteur AT2, caract6ris6e en ce qu'elle 
comprend : 

(a) la co-transformation d'lme souche de levure convenable 
5 avec deux vecteurs, h savoir (i) vm. vecteur codant pour un fragment contenant 
au moins la SEQ ID NO:5 de la prot6ine ATIP selon la revendication 6 mut6e 
ou non, fusionne k une prot6ine selectionnee dans le groupe constitu^ par le 
domaine de liaison k 1' ADN d'un facteur de transcription et le domaine d'acti- 
vation dudit facteur de transcription et (ii) un vecteur codant pour un 
10 fragment contenant l'extremit6 C-terminale du r^cepteur AT2 mut6 ou non, 
fusionn6 h une proteine s6lectionn6e dans le groupe constitu6 par le domaine 
de Uaison h I'ADN d'un facteur de transcription et le domaine deactivation 
dudit facteur de transcription, lesquels vecteurs comportent en outre des 
marqueurs de selection, I'un des deux vecteurs codant obligatoirement pour 

15 vme prot6ine mut6e et 

(b) la visualisation, par selection sur un milieu selectif conve- 
nable, de la perte 6ventuelle de I'interaction prot6ine ATIP selon la revendica- 
tion 6 ou selon la revendication 7-recepteur AT2. 

18°) Methode de selection de substances aptes h influencer 
20 I'interaction proteine ATIP selon la revendication 6 ou la revendication 7- 
r6cepteur AT2, laqueUe methode comprend : 

(a) la mise en contact de la prot6ine ATIP selon la revendica- 
tion 6 ou la revendication 7, fixee sur un support avec une proteine de fusion 
r^cepteur AT2-prot6ine Etiquette, 6ventuellement en presence d'une substance 

25 k tester, 

(b) au moins un lavage dudit support ainsi trait6 avec un 

tampon convenable et 

(c) la visualisation de l'6ventuelle interaction proteine ATIP 
selon la revendication 6 ou la revendication 7-r6cepteur AT2, en particulier en 

30 SDS-PAGE, suivie d'une immuno-empreinte avec des anticorps dirig6s centre 
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la prot§ine Etiquette, fusionn^e au recepteur AT2. 

19**) Methode de selection de substances aptes k interagir avec 
la prot^ine ATIP selon la revendication 6 ou la revendication 7, caracteris6e en 
ce qu'elle comprend : 
5 (a) la mise en contact de la prot6ine ATIP selon la revendica- 

tion 6 ou la revendication 7, fixee sur tm support, avec un lysat cellulaire, 

(b) au moins un lavage dudit support ainsi traits avec im 
tampon convenable, 

(c) la visualisation de T^ventuelle proteine associee a la pro- 
10 teine ATIP, en particulier en SDS-PAGE, suivie d'une immuno-empreinte avec 

des anticorps appropries et 

(d) Tidentification de la proteine du lysat cellulaire interagis- 
sant avec la prot6ine ATIP. 

20**) Utilisation des cellules co-transform6es selon Tune 
15 quelconque des revendications 10 k 13, pour la selection et le criblage de 
substances ou de prot6ines aptes k influencer I'interaction prot6ine ATIP- 
recepteur AT2 ou aptes k interagir avec la prot6ine ATIP. 
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LOCUS 



Extremite C-terminale recepteur AT2 160 BP DS-DNA 



ORGANISM Souris 
BASES 41 A 



33 C 



36 G 



50 T 



ac nucl^iques 1 TGTGTTAATC CCTTCCTGTA TTGTTTTGTT GGAAACCGCT 

TCCAACAGAA CGTCCGCAGT GTGTTTAGAG TTCCCATTAC 
TTGGCTCCAA GGCAAGAGAG AGACTATGTC TTGCAGAAAA 
121 GGCAGTTCTC TTAGAGAAAT GGACACCTTT GTGTCTTAAA 



Traduction en acides amines 

CVNPFLYCFV GNRFQQNVRS VFRVPITWLQ GKRETMSCRK 
GSSLREMDTFVS* 



Recepteur 
AT2 




Figure 1 
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GCTACCCCCCCCCCACGCACCCCCCAATCTGGGTGGCCTGGCATTAGCATGTAAGCTTGTTTTTCTCTGGC 71 
TGTATCTCTTGGCCTGGAAGAACCCCGAGTTGCCAAGAGACACAGTATGTGATGGTCCCTGGAAAAGCTGCT 14 



-i 



MLLSPKFSL 
TCCCCTGCGAAGTTCTCCCACTGGCTTCGAAGAC ATG CTG TTG TCT CCC AAA TTC TCC TTA 


9 

204 


S 
TCC 


T 
ACC 


I 

ATC 


H 
CAC 


V 
GTC 


R 
CGC 


L 
CTA 


T 
ACC 


A 
GCC 


K 
AAA 


G 
GGA 


L 
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L 
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CGA 


N 
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L 
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S 
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L 
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R 
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K 
AAA 


N 
AAC 


T 
ACT 


V 
GTC 


I 
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F 
TTC 


H 
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T 
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V 
GTT 


E 
GAA 


K 
AAG 


G 
GGC 


R 
AGG 


45 
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K 
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P 
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R 
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S 
AGC 
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C 
TGC 


I 
ATC 
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CAG 


T 
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Q 
CAG 


T 
ACA 


A 
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p 
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D 
GAT 
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GTG 


L 
CTG 


63 
366 


S 
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E 
GAG 


R 
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T 
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CTT 
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GCC 


Q 
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K 
AAG 
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AAA 
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GAA 
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CTT 
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GTC 


S 
AGC 
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R 
CGG 


G 
GGA 


E 
GAG 


L 
CTA 


V 
GTT 


135 
582 


A 
GCT 


A 
GCT 


S 
TCA 


S 
AGC 


A 
GCC 


C 
TGT 


E 
GAG 


K 
AAG 


L 
CTA 


£ 
GAA 
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AAG 
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CAG 
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CAG 
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CAG 
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CAT 
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CAG 
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ACA 
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GAC 
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CGG 
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ACG 


171 
690 



ELENRLKDLYTAECEKLQ 189 

GAA CTG GAG AAC CGG CTG AAG GAC TTA TAC ACC GCA GAG TGT GAG AAG CTT CAG 744 

SIYIEEAEKYKTQLQEQF 207 

AGC ATT TAC ATT GAG GAG GCA GAA AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT 798 

DNLNAAHETTKLEIEASH 225 

rt GAC AAC TTA AAC GCC GCC CAT GAG ACC ACT AAG CTT GAG ATT GAA GCT AGC CAC 852 

SEKVELLKKTYETSLSEI 243 

TCG GAG AAG GTG GAA TTG CTG AAG AAG ACC TAT GAA ACC TCC CTT TCA GAA ATC 906 

KKSHEMEKKSLEDLLNEK 261 

AAG AAG AGC CAT GAG ATG GAG AAG AAG TCA CTG GAG GAT CTG CTT AAT GAG AAG 960 

OESLEKQINDLKSENDAL 279 

CAG GAA TCG CTG GAG AAA CAA ATC AAT GAT CTG AAG AGT GAA AAC GAT GCT TTA 1014 

3nERLKSEEQKQLSREKAN 297 

AAC GAA AGG TTG AAA TCA GAG GAG CAA AAG CAA CTG T CA AGA GAG AAG^ GCG AAT 1068 

SKNPQVMYLEQELESLKA 315 

TCC AAA AAC CCT CAG GTC ATG TAT CTG GAG CAA GAA CTA GAA AGC CTG AAG GCT 1122 

■ 

Ficmr-e 3 . 1 
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1500 



CGGCTTCTGAACGC AGGAGACTCTCTGAAGGCACTGAGGTGCGCTTCTGCAGGACTGACCCTCTCATGGGA 1571 

ACTCGAGTTGCTGCGTTAGCTCTCTGGAATATCCCC AGGATATCGGGAGAGCAGCCGCCAACCGTATCAGC 1642 

TACGTACGAATAGAGAGCTCCAATAGAAGACTTTTAACTTGGTCCAAAAGCCTCCTCCAAAAACAGATTTC 1713 

GGAACTGAAGTGGACATAGTTGCACAAAGCACTTACGGAACGAGGGAACCTTGTTCTTTGCCTTCCTTCAC 1784 

CTAAGCATAGGCTTTCCAG 1803 



Figure 3u2 
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cagtgtgatgtggttcagaggcagcttctagacctgcaggagggagattgtattcagaggaagagcatcatt 
ttggcaacatctgaaagtgaaaacggaagccagaaacacctggccagccctgggggattcttttcttctatg 
cctctgtggtggaatgacatttgctgtgcaggcatccttcctctgactgtatttcttggccttgaagagtac 
tgagtttaaaaagacagtatgtgacagtccatggaaattgcctcttctgtgaaatctcgccacctgctccga 

agac ATG TTG TTG TCT CCC ^ TTC TCC TTA TCd ACC ATT CAC ATA CGA CTG ACG 

OCC AaI GGA TTG CTT CGA AAC CTT CGA CTT CCT TCA GO. TTT AGG AGA AGC ACT 

OTT =TT TTC CAC ACA CTT AAC ACC A^ CAA AAC AAT CCT CCA ACC TTA TOT 

ATC CAC CCA CAC ACA CCT CCC CAT CCG CTC CCC CCT CAG AAA ACA CTT CAA TTC 
iQPQTAPDALPPt.^ 

ACC CAA TAT AAA ACA AAA TCT CAA AAC CAA ACT CCA TTT ATC CTC CTC AAC 

cL L cL CCC TOT CCT AAT ACC AAC TTT C« CCA T^ ACA CTT CTC ATT CAC 
CAC c'^ C^ ^ CAC CCC C«. CAA CCA CTC AAA CAA CAC AAA ACC CTA TCT CAA 



TTA CAA AAA CCC ACC AAT CAC TTA CAA ACA CTC TAT CAA CCA TTC CTC CAC CAC 
L cL cl AAA ACA CAA COA CAC - CCC CTT AJ. CAC TTT TAC ACC ACC 

oL TAT GAA AAC CTT CCO C AC ACT TAC ATT CAA CAA CCA CAC AAC TAC AAA ATC 
cL L cL cjc L TTT CAC AAC TTA AAT CCC CAT CAA ACC T^ AAO TTG CAA 



TCC err tca' caa a^t aac aaa cgc cat CAA ATA caa AAG AAA TCC CTT CAA CAT 
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Figure_Ai 
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aggactgaccccaaggaggaacgtgggcacaagaggtatatcagcacacgtgtgatcaccgtaggtaactgg 1723 
agcgtcaccaccggcggaatcgagcttctgagactggaagtctggaggaagacttttgcctccgtccaaaag 1795 
attcctccaaaaaaagatttaaaaaaagatttcggcatcgacacggacgttgttgcacaaagcacttaaaga 1867 
acgagagcatcttgttcattgcctttttcacctaagcataaggggaaaaactctcagggccccattaagatt 1939 
tataacctttgtaatgttcttcaccacagacaccttcttgtgagttttcagtctgactgtgggggtgggggg 2011 
tgtgaatgaaatggatgtcacagagtgtcatgtgtctgatgcagcctcctctgctgtgtattaaatgtcaaa 2083 
atctgaatatatctggatatgtactaatcaaataataatcaatcaatcagcatatacatttcagccaaagcc 2155 
atagaagaaaaagcaatagttgcttgaattatgatcatctaccaccaactctgctcagccctgtiaacagggt 2227 
agggagagggtataacaggaagagctttgacttgtccctgtctatacattctccgtatcttttgggggtaac 2299 
ttcttggcagtttttcagtgttcagccatgtcagttgaaactagatttttctgtagattttttacttaccca 2371 
tgtgagcctaacactatcctgtaattcattttctcaggctatgtgtaaatgtagaaccctaatttttctata 2443 
aaaaaacaaactaactaactgtgtaaagaaagaaaaagggaagtaccaatgggtttttccaccttattttta 2515 
cctttgatctacccttgcagatttaacctgtcttcttccctcccattattctcattttccttttacctttct 2587 
ccaccatccagagccacaaaagcaaaccttctacctcctacctacttttctctgggacaaggataaaggaat 2659 
atgattttccagagccccagagccagctcatcttccaggtgctgaaaccactttccaaataaactaaagcct 2731 
ggatttgatattacaaattttgggaaatcttagaataaagaacgagaacaaggaagtcattggctagtataa 2803 
ttaagaaaggtaggattcagtgcttaccgatgatgcagtacttgatagaagaaaacagtctgggaggatagc 2875 
gctcatttttcagttaccctttaaggagtccctttgtctttgggaaagtagcagaatggtccgcttctttcc 2947 
catgagtggaaaatgtggcttgtccaactctcctccaggttgcatttcagtttctttccaaaacttattacc 3019 



Figure 4.2 
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tcccccaatcctgagactctggaaaaggtggaaggaagaactgttgctttatctccccctccctgcatgtgt 3091 
caacattgtgatgtcagtacttactaatctacattcagcggctgtacaaataacagctgcagtaagaagaga 3163 
ttcaggatgctagaggcgaacatccgggtcatttacatgtacactacatagcaagtcgatactcatgttgca 323S 
tgctcttttaaattagtgatttcgtgtcttaagtctttaacttccaatacttcatcatgtatgtaaccttcc 3307 
atgtttgcttctgataaatggaaacgtaggttcactgccacttcatgagacatctctgctcacgcttccaag 3379 
ttgttctcaatgacattagccaaagttgggtttgccatccaccccctaggcatggtaaatcctgtgtcgttc 3451 
cctgctgtcctccgtattacgtgaccggcaaataaatctcatagcagttaatataaaacatctttggaggat 3523 
gggagagaacaggagggaagatgggaaacaaaatagagaattcccaagatcctgtttaaaccaaatgtttca 3595 
tgtagaatgcaaaacgttggcacgccaaaaatacgaatgcgtagacaactgtagctgtgctcagtttgtagt 3667 
gatgggaagtgcattttactctgaccaaacaaacaatgctggaatactcaaaaaaaaaaaaaaaaaaaaaaa 3739 

3742 

aaa 



Ficnire 4.3 
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EcoRI 




Hind III 



Hind III BamH I NotI EcoRI 

i 1 i i 

▼ ► ATG I ^NL I VP16 i ▼ ▼ -A- ' 

Phase de lecture: ... TGG ATC CCC insert 
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